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(54) $ltle: POLYPEPTIDE NUCLEIC SEQUENCES EXPORTED FROM MYCOBACTERIA, VECTORS COMPRISING SAME AND 
USES FOR DIAGNOSING AND PREVENTING TUBERCULOSIS 

(54) ^tre: SEQUENCES NUCLEIQUES DE POLYPEPTIDES EXPORTES DE M YCOB ACTERIES , VECTEURS LES COMPRENANT 
ET APPLICATIONS AU DIAGNOSTIC ET A LA PREVENTION DE LA TUBERCULOSE 



(57) Abstract 

The invention concerns recombinant vectors replicated in mycobacteria, a set of sequences coding for exported polypeptides detected 
by fusion with alkaline phosphatase, in particular one polypeptide, called DP428, of about 12 kD corresponding to an exported protein found 
in mycobacteria belonging to the Mycobacterium tuberculosis complex. The invention also concerns methods and kits for detecting in vitro 
the presence of a mycobacterium and in particular a myecrbacterium belonging to the Mycobacterium tuberculosis complex in a biological 
sample using said polypeptides, their fragments or polynucleotides coding for the latter. Hie invention also concerns immunogenic or 
vaccine compositions for preventing and/or treating infections caused by mycobacteria and in particular a mycobacterium belonging to said 
complex, particularly tuberculosis. 



(57) Abrege" 

L'invcntion a pour objet des vecteurs recombinants sc replicant chez les mycobacteries, un ensemble de sequences codant pour 
des polypeptides exports d6tectes par des fusions avec la phosphatase alcaline, notammentun polypeptide, denomm6 DP428, d'environ 
12kD correspondant a une proline exportee retrouvee dans les mycobacteries appartenant au complexe de Mycobacterium tuberculosis, 
L'invention concerne egalement des proc6des et des kits de d6tection in vitro de la presence d'une mycobacterie et en particulier une 
mycobacteric appartenant au complexe de Mycobacterium tuberculosis dans un echantillon biologique utilisant lesdits polypeptides, leurs 
fragments ou des polynucleotides codant pour ces demiers. L'invention vise des compositions immunogenes ou vaccins pour la prevention 
et/ou le traitement d'infecdons provoquees par des mycobacteries et en particulier une mycobacteric appartenant audit complexe, en 
particulier la tuberculose. 
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Sequences nucleiques de polypeptides exportee de 
mycobacteries, vecteurs lea compranant et applications au 
diagnostic et a la prevention de la tuberculosa . 

5 V invention a pour objet de nouveaux vecteurs 

recombinants de criblage, de clonage et/ou d 1 expression se 
rfipliquant chez les mycobacteries . Elle a 6galement pour 
objet un ensemble de sequences codant pour des polypeptides 
exportfis detectes par des fusions avec la phosphatase 
to alcaline et dont ^expression est regulfie (induite ou 
reprim6e) ou constitutive lors de l 1 ingestion des 
mycobacteries par les macrophages. L' invention concerne 
egalement un polypeptide, d§nomme DP428, d' environ 12kD 
correspondant Sl une proteine export6e retrouv£e dans les 
15 mycobacterias appartenant au complexe de Mycobacterium 
tuberculosis. L 1 invention vise aussi un polynucleotide 
comprenant une sequence codant pour ce polypeptide. Elle 
concerne egalement 1 ' utilisation du polypeptide ou de" 
fragments de celui-ci et des polynucleotides codant pour 
20 ces derniers (ou encore les polynucleotides complementaires 
a ces derniers) pour la realisation de moyens de detection 
in vitro, ou in vivo de la presence d'une mycobacterie 
appartenant au complexe de Mycobacterium tuberculosis dans 
un echantillon biologique ou pour la detection de reactions 
25 de l'hote infecte par ces esp&ces bacteriennes . L* invention 
vise enfin l 1 utilisation du polypeptide ou de fragments de 
celui-ci ainsi que des polynucleotides codant pour ces 
derniers en tant que moyens destines S la preparation d'une 
composition immunog&ne, susceptible d'induire une reponse 
30 immunitaire dirigee contre les mycobacteries appartenant au 
complexe de Mycobacterium tuberculosis, ou d'une 
composition vaccinale pour la prevention et/ou le 
traitement d' infections provoquees par des mycobacteries 
appartenant audit complexe, en particulier la tuberculose. 

35 
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La presente invention a aussi pour but d* utilizer ces 
sequences (polypeptidiques et polynuel6otidiques) comme 
5 cible pour la recherche de nouveaux inhibiteurs de la 
croissance et de la multiplication des mycobact£ries et de 
leur maintien chez l*h6te, ses inhibiteurs pouvant servir 
d ■ ant ibiot iques . 

10 Le genre Mycobacterium, qui comprend au moins 56 

especes diff^rentes, inclut des pathogenes humains majeurs 
tels que M. leprae et M. tuberculosis, les agents 

responsables de la lepre et de la tuberculose, qui restent 
des probl&mes graves de sante publique dans le monde 
15 entier. 

La tuberculose continue d'etre un probleme de sant£ 
publique dans le monde. Aujourd'hui, cette maladie est la, 
cause de 2 a 3 millions de morts dans le monde et environ 8 
20 millions de nouveaux cas sont observes chaque annee 
(Bouvet, 1994). Dans les pays developp£s M. tuberculosis 

est la cause la plus commune des infections 
mycobact€riennes . En France il apparait environ 10 000 
nouveaux cas par an et parmi les maladies a declaration 
25 obligatoire c'est la tuberculose qui comprend le plus grand 
nombre de cas. La vaccination par le BCG {Bacille de 
Calmette et Gu§rin) , une souche avirulente d£riv§e de M. 

Jbovis et qui est tr£s utilisde comme vaccin contre la 

tuberculose, est loin d'etre efficace au sein de toutes les 
30 populations. Cette efficacite varie environ de 80 % dans 
les pays occidentaux comme 1 1 Angleterre, I 0 % en Inde 
(resultats du dernier essai de vaccination a Chingleput . , 
publies en 1972 dans Indian J, Med. Res.). De plus, 
1* apparition de souches de M. tuberculosis resistantes aux 

35 antituberculeux et le risque accru chez les patients 
immunod£prim§s , patients atteints du SIDA, de d^velopper 
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une tuberculosa , rendent n£cessaire la mise au point de 
m£thodes rapides, specif iques et fiables pour le diagnostic 
de la tuberculosa et la mise au point de nouveaux vaccins. 
Par exemple, une 6tude 6pidemiologique realis£e en Floride, 

5 et dont les r£sultats ont 6t6 publics en 1993 dans AIDS 
therapies, a montr£ que 10 % des malades atteints de SIDA 
sont atteints de tuberculose au moment du diagnostic du 
SIDA ou 18 mois avant celui-ci. Chez ces malades, la 
tuberculose apparait dans 60 % des cas sous une forme 

10 dissemin£e done non reperable par les crit&res de 
diagnostic classiques comme la radiographic pulmonaire ou 
1* analyse de crachats. 

Actuellement , une certitude sur le diagnostic apportfi 
IS par la mise en evidence de bacilles cultivables dans un 
prelevement provenant du malade n'est obtenue que pour 
moins de la moitie des cas de tuberculosa, meme dans les 
cas de tuberculose pulmonaire. Le diagnostic de la 
tuberculose et des autres mycobacterias apparentees est 
20 done difficile a realiser, et cela pour diffSrentes 
raisons : les mycobact£ries sent souvent presentes en 
faible quantity, leur temps de generation est tres long 
(24h pour M, tuberculosis) et leur culture est difficile. 
(Bates et al w 1986) . 

25 

D 1 autres techniques sont utilisables en clinique, pour 
identifier une infection mycobacterienne : 

a) L' identification directe des microorganismes au 
microscope ; cette technique est rapide, mais ne permet pas 
30 1 ' identification de l»espdce mycobacterienne observee et 
manque de sensibility (Bates, 1979) . 

Les cultures, lorsqu'elles sont positives, ont une 
specificity approchant 100 % et permettent 1 • identification 
de I'espece mycobacterienne isol£e ; nfeanmoins, comme 
35 precis^ ci-dessus, la croissance des mycobacteries in vitro 

est longue (ne peut etre r£alisee qu'.en 3 a 6 semaines de 
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cultures r£p£tees (Bates, 1979 ; Bates et al . , 1986)) et 
coQteuse . 

b) Les techniques s£rologiques peuvent s'avSrer utiles 
5 dans certaines conditions, mais leur utilisation est 

parfois limit6e par leur sensibility et/ou leur sp6cificit6 
faibles (Daniel et al., 1987). 

c) La presence de mycobact6ries au sein d'un 
K) tchantillon biologique peut aussi etre d^terminee par 

hybridation molficulaire avec de l'ADN ou de l'ARN en 
utili&ant des sondes d* oligonucleotides specif iques des 
sequences recherch£es (Kiehn et al., 1987 ; Roberts et al., 
1987 ; Drake et al., 1987). Plusieurs etudes ont montre 

15 I'interSt de cette technique pour le diagnostic des 
infections Sl mycobact^ries . Les sondes utilis6es sont 
constitutes d'ADN, d'ARN ribosomique ou de fragments d'ADN 
mycobacteriens provenant de banque de genes. Le principe de 
ces techniques repose sur le polymorphisme des sequences 

20 nucl6otidiques des fragments utilises ou sur le 
polymorphisme des regions avoisinantes . Dans tous les cas, 
elles necessitent 1 'utilisation de cultures et ne sont pas 
applicables directement sur les €chantillons biologiques. 

25 La faible quantite de mycobact6ries prfesentes au sein 

d'un §chantillon biologique et en consequence la quantity 
faible d'ADN cible a d£tecter dans cet echantillon peut 
n£cessiter le recours a une amplification sp6cifique in 
vitro de l'ADN cible avant sa detection a I'aide de la 

30 sonde nucleotidique et en utilisant des techniques 
d' amplification in vitro telles que la PCR (amplification 

en chaine 3 la polymerase, L' amplification specif ique de 
l'ADN par la technique PCR peut constituer la premiere 
§tape d'un proc§d6 de detection de la pr6sence d'un ADN 
35 mycobact^rien dans un Schantillon biologique, la detection 
proprement. dite de l'ADN amplifi6 etant effectuee dans un 
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second temps a 1'aide d'une sonde oligonucieotidique 
capable de s'hybrider specif iquement a l'ADN amplifie* 

Un test de detection de mycobacterias appartenant au 
complexe de Mycobacterium tuberculosis, par hybridation 

5 sandwich (test utilisant une sonde de capture et une sonde 
de detection) a 6te d£crit par Chevrier et al , en 1993. le 
complexe de Mycobacterium tuberculosis est un groupe de 

mycobacterias qui comprend M. bovis-BCG, M. bovis, M. 

tuberculosis, M, africanum et M. microti. 

to 

Un precede de detection de faibles quant it£s de 
mycobacteries, appartenant au complexe tuberculosis, par 
amplification genique et hybridation directement sur des 
echantillons biologiques a &t€ mis au point. Ledit proc^de 

15 utilise la sequence d'insertion 1S6110 (Brevet europ6en EP 
0 490 951 Bl) . Thierry et al. ont d€crit en 1990 une 
sequence specifique du complexe Mycobacterium tuberculosis 
et nommee IS 6110. Certains auteurs ont propose 
d 'amplifier specif iquement l'ADN provenant de 

20 Mycobacterium en utilisant des amorces nucl6iques dans une 

methode d 1 amplification, telle que la reaction de 
polymerase en chalne (PGR). Patel et al. ont d6crit en 1990 
1* utilisation de plusieurs amorces nucleiques choisies Sk 
partir d'une sequence connue en tant que sonde dans 
25 1* identification de M. tuberculosis, Cependant, la longueur 
des fragments obtenus en utilisant ces amorces 6tait 
different© de la longueur theorique attendue et plusieurs 
fragments de taille variable etaient obtenus. De plus, les 
auteurs ont observe l 1 absence d* hybridation des produits 
30 amplifies avec le plasmide ayant servi a determiner les 
amorces. Ces r6sultats indiquent que ces amorces ne 
seraient pas appropriees dans la detection de la presence 
de M. tuberculosis dans un Schantillon biologique et 

confirment la nature critique du choix des amorces. La meme 
35 annee, J..L. Guesdon et D. Thierry ont decrit une methode de 
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detection de M, tuberculosis, de grande sensibility, par 

amplification d'un fragment d * ADN de M. tuberculosis 

localise au sein de la sequence IS6110 (Brevet europ£en EP 
461 045) a 1'aide d 1 amorces g£n£rant des fragments d'ADN 

5 amplifi6 de longueur constante, m§me lorsque le choix des 
amorces conduisait & 1 ' amplification de fragments longs (de 
l'ordre de 1000 S 1500 bases) oO le risque d 1 interruption 
de la polymerisation est 6iev6e en raison des effets de la 
structure secondaire de la sequence. D'autres amorces 

10 specifiques de la sequence IS6110 sont decrites dans le 
brevet europeen N° EP-0490 951. 

Las inventeurs ont montre (resultats non publies) que 
certains isolats cliniques de Mycobacterium tuberculosis 

15 etaient exempts de la sequence d* insertion IS6110 et ne 
pouvaient done etre d£tectes & l'aide des oligonucleotides 
specifiques de cette sequence pouvant conduire ainsi a des 
resultats de diagnostic faussement ndgatifs. Ces resultats 
confirment une observation similaire faite par Yuen et al . 

20 en 1993* L 1 impossibility de detecter ces souches pathogenes 
potentiellement presentes dans un echantillon biologique 
pr61eve sur un patient est ainsi susceptible de conduire £ 
des difficult6s voire des erreurs de diagnostic. La 
disponibilite de plusieurs sequences specifiques du Bacille 

25 de la tuberculose, a l f intSrieur desquelles des amorces 
appropriSes pour 1 1 amplification seront choisis, est 
importante. La sequence DP428 decrite ici pourra etre 
utilisee. 

3° bovis et tuberculosis, les agents causals de la 

tuberculose, sont des bacteries facultatives intra - 
cellulaires. 

Ces agents ont d6velopp6 des m^canismes pour assurer 
35 leur survie et leur replication a 1 ' int€rieur du 
macrophage, un des types cellulaires qui est suppose 
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gradiquer 1* invasion par des microorganismes . Ces agents 
sont capables de moduler 1' evolution normale de leur 
phagosome et de les empecher de se diff£rencier en un 
compart intent acide riche en hydrolase (Clemens, 1979 ; 

5 Clemens et al , , 1996; Sturgill-Koszycki et al . , X994 et Xu 
et al., 1994), Cependant, cette modulation n'est possible 
que si la bactferie est vivante au sein du phagosome, 
sugg6rant que des composes synth£tis£s de mani&re active 
et/ou s6cr6t6s a 1 • intSrieur de la cellule font partie de 

io ce m^canisme. Des proteines export^es sont probablement 
impliquees dans ce m6canisme. En depit des problemes 
majeurs de santS li6s a ces organismes pathogenes, on salt 
peu de choses sur leurs prot6ines export^es et/ou 
secrStees, Des analyses en SDS-PAGE de filtrat de culture 

15 de M. tuberculosis montrent au moins 30 proteines s6cr£tees 

(Altsehul et al., 1990 ; Nagal et al . , 1991 et Young et 
al,, 1992). Certaines d'entre elles ont ete caract£risees, 
leurs g&nes clones et sequences (Borremans et al . , 1989 ; 
Wiker et al., 1992 et Yamaguchi et al . , 1989). D'autres, 

20 bien qu'il s'agisse d'antigenes immunodominants 
d' importance majeure pour induire une immunite protectrice 
(Anderson et al.,1991 et Orme et al . , 1993), ne sont pas 
totalement identifies. En outre, il est probable que de 
nombreuses protSines export£es restent fix6es sur la 

25 membrane cellulaire et par consequent ne soient pas 
pr£sentes dans les sumageants de culture. II a €t6 montrfe 
que les proteines localisees ei la surface externe de 
di verses bact£ries pathogenes, telles que l'invasine de 103 
kDa de Yeraina Pseudotuberculosis (Isberg et al., 1987) ou 

30 1 ' internaline de 80 kDa de Listeria monocytogenes (Gaillard 

et al., 1991 et Dramsi et al*, 1997) jouent un role 
important dans les interactions avec les cellules hotes et 
par consequent, dans la pathogenicity comme dans 
l 1 induction de r£ponses protectrices ♦ Ainsi, une proteine 
35 li6e a la membrane pourrait etre importante pour 
1' infection a AT. tuberculosis comme pour 1' induction de 
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r€ponse protectrice centre cette infection. Ces proteines 
pourraient revetir un interet certain pour la preparation 
de vaccins, 

5 R6cemment, il a 6t6 d6crit 1' adaptation aux 

mycobact£ries d'une mfithodologie g6n6tique pour 
1 1 identification et la selection ph6notypique de protSines 
export6es (Lim et al . , 1995) . Cette methode utilise la 
phosphatase alkaline (PhoA) pfiriplasmique d'E. coli. Un 

10 vecteur plasmidique a 6te construit permettant la fusion de 
g&nes entre un g&ne PhoA tronquS et des genes codant pour 
des proteines export£es (Manoil et al . , 1990). 

Par cette methode, il a pu etre identifi£ un gene 
15 de M* tuberculosis (erp (Berthet et al., 1995)) presentant 
des homologies avec une protfiine export6e de 28 kDa de M. 
leprae, qui est une cible frequente des r6ponses humorales 
de la forme lepromateuse de la lepra, Une proteine 
presentant des motifs aminoacides caract6ristiques de la 
20 d6saturase de plante (des) a aussi ete caract6ris6e par la 
technique de fusion avec PhoA. 

Cependant, cette methode gen6tique d' identification 
de proteines export£es ne permet pas d'6valuer facilement 

25 1* expression intracellulaire des genes correspondants . Une 
telle Evaluation est d'une importance primordiale £ la fois 
pour la selection de bons candidats vaccina et pour la 
comprehension des interactions entre les bact£rie9 et leurs 
cellules hdtes. L' induction de 1 4 expression de facteur de 

30 virulence par contact de cellule cible pathogene a 6te 
dgcrite, C'est le cas par exemple pour les facteurs de 
virulence Yops (Petersson et al., 1996) de Yersinia 

pseudotuberculosis. Shigella par contact avec les cellules 
cibles relargue les prolines Ipa dans le milieu de 
35 culture, .et Salmonella synthetise de nouvelles structures 
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de surface, 

Compte tenu de ce qui precede, il existe aujourd'hui 
un grand besoin de dSvelopper de nouveaux vaccins contre 

5 les mycobacterias pathogenes ainsi que de nouveaux tests de 
diagnostic specif iques, fiables et rapides. Ces 
d£veloppements n^cessitent la mise au point d'outils 
spScif iques encore plus performants permettant, d'une part, 
d'isoler ou d'obtenir des sequences de nouveaux 

10 polypeptides 9p6cif iques, notamment immunogenes, et, 
d 1 autre part, de mieux comprendre le mecanisme des 
interactions entre les bact6ries et leurs cellules hotes 
comme notamment l 1 induction de 1* expression de facteur de 
virulence . Ceci est pr6cisement l*objet de la presents 

15 invention. 

Les inventeurs ont defini et r6alis£ dans ce but de 
nouveaux vecteurs permettant le criblage, le clonage et/ou 
1' expression de sequences d'ADN de mycobacteries afin 

20 d' identifier parmi ces sequences, des acides nucleiques 
codant pour des prolines d'intSret, de pr€f6rence des 
prot6ines export6es, pouvant etre localisees sur la 
membrane bact6rienne et/ou secr£tees, et d' identifier parmi 
ces sequences celles qui sont induites ou r€primees lors de 

25 1* infection (croissance intracellulaire) . 

Description 

La pr£sente invention d6crit 1 'utilisation du gene 
30 rapporteur phoA chez les mycobacteries. II permet 

d 1 identifier des syst&mes d 1 expression et d* exportation 
dans un contexte mycobact€rien . Beaucoup de g&nes ne sent 
exprimSs que dans un tel contexte, ce qui montre l'avantage 
de la presente invention. Au cours du clonage de segments 
35 d'ADN de souches du complexe M. Tuberculosis en fusion avec 
phoA dans - une autre mycobacteria comme M. smegma tis, le 
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debut du g£ne, ses regions regulatrices et son regulateur 
seront clones ce qui permettra d* observer une regulation. 
Si cette regulation est positive, le clonage du regulateur 
constituera un avantage pour observer 1' expression et 
5 1 'exportation* 

Dans le contexte de 1* invention, on entend par 
mycobactSrie toutes les mycobacteries appartenant aux 
diverses espeees 6num6r6es par Wayne L. G. and Kubica G . P. 
10 (1980). Family Mycobacteriaceae in Bergey's manual of 
systematic bacteriology, J. P. Butler Ed. (Baltimore USA : 
Williams et Wilkina P, 1436-1457), 

Dans certains cas les g&nes clones sont soumis dans 
15 leur hote d'origine a une regulation negative rendant 
l 1 observation de l 1 expression et de 1 1 exportation difficile 
chez l'hote d'origine. Dans ce cas, le clonage du gene en 
absence de son regulateur n6gatif, dans un h6te ne le 
contenant pas, constituera un avantage. 

20 

L 1 invention vise aussi de nouveaux polypeptides et de 
nouveaux polynucleotides de mycobacteries ayant pu etre 
isoies au moyen des vecteurs precedents et siisceptibles 
d'entrer dans la realisation de compositions pour la 
25 detection d'une infection par des mycobacteries, ou pour la 
protection cohtre une infection due 3. des mycobateries ou 
pour la recherche d» inhibiteurs comme cela est decrit 
precedemment pour DP428. 

30 

L* invention a done pour objet un vecteur recombinant 
de criblage, de clonage et/ou d*expression, caracterise en 
ce qu f il se replique chez des mycobacteries et en ce qu'il 
contient : 

35 

1) un r6plicon fonctionnel chez les mycobacteries ; 

2) un marqueur de selection ; 
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3) une cassette rapporteur comprenant : 

a) un site de clonage multiple (polylinker) , 

b) eventuellement un terminateur de transcription 
5 actif chez les mycobacterias, en amont du polylinker, 

c) uhe sequence nucieotidique codante issue d'un gene 
codant pour un marqueur d ' expression, d 1 exportation et/ou 
de secretion de proteine, ladite sequence nucieotidique 
etant depourvue de son codon d» initiation et de ses 

10 sequences de regulation, et 

d) une sequence nucieotidique codante issue d'un gdne 
codant pour un marqueur d'activite de promoteurs contenus 
dans le meme fragment, ladite sequence nucieotidique etant 
pourvue de son codon d 1 initiation . Eventuellement , le 

15 vecteur recombinant contient egalement un rSplicon 
fonctionnel chez E. coli. 

De maniere preferee, le marqueur d 1 exportation et/ou 
de secretion est place dans la meme orientation que le 
20 marqueur d* activity de promoteurs. 

PrSferentiellement, le vecteur recombinant de criblage 
selon 1' invention comprendra, en outre, un terminateur de 
transcription place en aval du marqueur d'activite de 
25 promoteurs, ce qui est de nature a permettre I'obtention de 
transcrits courts qui se r6v&lent plus stables et qui, par 
consequent, permettent un plus haut niveau d 1 expression des 
produits de traduction. 

30 Le marqueur d' exportation et/ou de secretion est une 

sequence de nucleotides dont i • expression suivie de 
1 Exportation et/ou de la secretion depend des elements de 
regulation qui controlent son expression. 

35 Par "sequences ou elements de regulation de 

1' expression de la production de polypeptides et de sa 
localisation", on entend une sequence promotrice de la 
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transcription, une sequence comprenant le site de liaison 
au ribosome (RBS) , les sequences responsables de 
1 'exportation et/ou la s6cr6tion telles que la sequence 
dite sequence signal. 

5 

Un premier marqueur int^ressant d* exportation et/ou 
d' expression est une sequence codante issue du g6ne phoA. 
Le cas 6ch6ant, elle est tronqu<§e de telle fagon que 
l 1 activity phosphatase alcaline est cependant susceptible 
10 d'etre restaur£e lorsque la sequence codante tronquee est 
plac6e sous le controle d'un promoteur et d« elements de 
regulation appropri£s. 

D'autres marqueurs d'exposition, d 1 exportation et/ou 
15 de secretion peuvent etre utilises. On citera a titre 
d'exemples une sequence du g&ne P-agarase, de la nuclease 
d'un staphylocoque ou d'une p- lactamase. 

Parmi les marqueurs interessants d'activite de 
20 promoteurs contenus dans le meme fragment, on pr6fere une 
sequence codante issue du g6ne Juc de luciferase de luciole 
pourvue de son codon d* initiation . 

D'autres marqueurs d'activite de promoteurs contenus 
25 dans le meme fragment peuvent etre utilises. On citera a 
titre d'exemples une sequence du g&ne de la GFP (Green 
Fluorescent Protein) , 

Le terminateur de transcription doit etre fonctionnel 
30 chez les mycobactSries. Un terminateur avantageux est a cet 
6gard le terminateur du coliphage T4 (tT4) . D'autres 
terminateurs appropries pour la realisation de 1* invention 
peuvent etre isoles en utilisant la technique presentee 
dans les exemples, par exemple au moyen d'une cassette 
35 "omega" (Prentki et al M 1984). 
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Un vecteur particulidrement pr6fer£ pour la 
realisation de 1' invention est un plasmide choisi parmi les 
plasmides suivants deposes Sl la CNCM (Collection Nationals 
de Cultures de Microorganismes, 25 rue de Docteur Roux, 
5 75724 Paris cedex 15, France) : 

a) pJVEDa depos6 & la CNCM sous le N° 1-1797, le 12/12 

1996, 

b) pJVEDb d6pos£ Sl la CNCM sous le N° 1-1906, le 25 
10 juillet 1997, 

c) pJVEDc d£pos6 a la CNCM sous le N° 1-1799 , le 
12/12 1996, 

Pour la s61ection, ou 1 ' identification de sequences 
15 d'acides nucl€iques de mycobact6ries codant pour des 
polypeptides susceptibles d'etre incorpores dans des 
compositions immunogenes, ou antigeniques pour la detection 
d'une infection, ou susceptibles d'induire ou de r6primer 
un facteur de virulence de mycobacteries, le vecteur de 
20 1" invention comprendra, en 1'un des sites de clonage 
multiple du polylinker, une sequence de nucleotides d'une 
mycobactfirie chez laquelle on d£tecte la presence de 
sequences correspondant S des polypeptides exportfes et/ou 
secretes pouvant etre induits ou reprim6s lors de 
25 1' infection, ou encore exprim6s ou produits de fa^on 
constitutive, leurs sequences promotrices et/ou 
regulatrices associees susceptibles de permettre ou de 
favoriser 1 1 exportation et/ou la s6cr6tion desdits 
polypeptides d'int6ret, ou tout ou partie de genes 
30 d'interet codant pour lesdits polypeptides - 

De preference, cette sequence est obtenue par 
fragmentation physique ou par digestion enzymatique de 
1 1 ADN genomique ou de l'ADN compl£mentaire d'un ARN d'une 
35 mycobact6rie, de preference M. tuberculosis ou choisie 
parmi M, africanum, M> bovis, M. avium ou M. leprae. 
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Les vecteurs de 1' invention peuvent en effet 6galement 
etre utilises pour determiner la presence de sequences 
d'int£ret, de pr£f6rence correspondant sL des prot6ines 
export6es et/ou s6cr£t£es, et/ou capables d'etre induites 
5 ou r6prim6es ou produites de fa<?on constitutive lors de 
l 1 infection, notamment lors de la phagocytose par les 
macrophages, et selon ce qui a 6t6 expos6 prfecfedemment , 
chez des mycobact6ries telles que M. africanum, M. bovia, 

M. avium ou M. leprae dont on aura traits 1 1 ADN ou 1 1 ADNc 

10 par fragmentation physique ou avec des enzymes d6termin£es. 

Selon un premier mode de realisation de I 1 invention la 
digestion enzymatique de 1 1 ADN genomique ou de 1 'ADN 
complementaire est effectu£e a partir de M. tuberculosis. 

5 De pr££6rence cet ADN est diger6 avec une enzyme telle 

que sau3A, BclI # Bgl-II. 

D'autres enzymes de digestion telles que Seal, Apal, 
Sad I, Kpnl ou encore des nucleases ou des polymerases, 
20 peuvent naturellement etre mises en oeuvre, dds lors 
qu'elles permettent l'obtention de fragments dont les 
extr6mites peuvent §tre ins§r£es dans 1 ' un des sites de 
clonage du polylinker du vecteur de 1* invention. 

Le cas €ch6ant, des digestions avec diff6rentes 
25 enzymes seront effectuees simultanement , 

Des vecteurs recombinants pr£fer£s pour la realisation 
de I 1 invention sont choisis parmi les vecteurs recombinants 
suivants dfeposfis k la CNCM : 
30 a) p6D7 deposS le 28 janvier 1997 a la CNCM sous le N°l- 
1814, 

b) p5A3 d6pos6 le 28 janvier 1997 & la CNCM sous le N°I- 
1815, 

c) p5F6 d£pos§ le 28 janvier 1997 a la CNCM sous le N°I- 
35 1816, 

d) p2A29 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1817, 
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e) pDP428 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1818, 

f) p5B5 depose le 28 janvier 1997 a la CNCM sous le N°l- 
5 1819, 

g) plC7 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1820, 

h) p2D7 depose le 28 janvier 1997 a la CNCM sous le N<>I- 
1821, 

10 i) plB7 depose le 31 janvier 1997 a la CNCM sous le N°I- 
1843, 

j) pJVED/W. tuberculosis depose le 25 juillet 1997 a la 

CNCM sous le N° 1-1907, 
k) pMlC25 depose le 4 aoQt 1998 a la CNCM sous le n<'l-2062. 



15 



20 



Parrai les plus preferes, on prefere le vecteur 
recombinant pDP428 depose le 28 janvier 1997 a la CNCM sous 
le N»I-1818, et le vecteur pMlC25 depose le 4 aout 1998 a 
la CNCM sous le N° 1-2062. 



L' invention a egalement pour objet un procede de 
criblage de sequences de nucleotides issues de 
mycobacteries pour determiner la presence de sequences 
correspondant a des polypeptides exportes et/ou secretes 

25 pouvant itre induits ou reprim6s lors de 1' infection, leurs 
sequences promotrices et/ou regulatrices associ6es 

susceptibles notamment de permettre ou de favoriser 
1' exportation et/ou la secretion desdits polypeptides 
d'interet, ou tout ou partie de genes d'interet codant pour 

30 lesdits polypeptides, caracterise en ce qu'il met en oeuvre 
un vecteur recombinant selon 1' invention. 

L' invention concerne aussi un procede de criblage, 
selon 1' invention, caracterise en ce qu'il comprend les 
etapes suivantes : 

35 

a) la fragmentation physique des sequences d'ADN de 
mycobacteries ou leur digestion par au moins une enzyme 
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d^terminee et la recuperation des fragments obtenus ; 

b) l 1 insertion des fragments obtenus ct l'6tape a) dans 
un site de clonage, compatible le cas 6ch6ant avec 1' enzyme 
de l # 6tape a), du polylinker d'un vecteur selon 

5 l 1 invention ; 

c) si besoin, 1 ■ amplification desdits fragments 
contenus dans le vecteur, par exemple par replication de ce 
dernier apres insertion du vecteur ainsi modifi£ dans une 
cellule d£termin6e, de pr6f6rence E coli ; 

10 d) la transformation des cellules hotes par le vecteur 

amplifi6 a l'6tape c) , ou en l'absence d' amplification, par 
le vecteur de iretape b) ; 

e) la culture des cellules hotes transformSes dans un 
milieu permettant la mise en Evidence du marqueur 

IS d 1 exportation et/ou de s6cr6tion, et /ou du marqueur 
d' activity de promoteurs contenu dans le vecteur ; 

f) la detection des cellules hdtes positives (colonies 
positives) pour 1' expression du marqueur d 1 exportation 
et/ou de secretion, et /ou du marqueur d'activite de 

20 promoteurs ; 

g) l'isolement de l'ADN des colonies positives et 
1* insertion de cet ADN dans une cellule identique h celle 
de l'§tape c) / 

h) la selection des insertions contenues dans le 
25 vecteur, permettant 1'obtention de clones positifs pour le 

marqueur d* exportation et/ou de secretion, et /ou pour le 
marqueur d* activity de promoteurs ; 

i) I'isolement et la caract€risation des fragments 
d 1 ADN de mycobacteries contenues dans ces inserats. 

» ■ 

Dans l'un des modes de realisation pref6r§s du proc6d6 
de criblage selon 1* invention, les cellules botes 
positives, detect6es S l'etape f ) , pour le marqueur 
d 1 exportation et/ou de secretion sont, 6ventuellement dans 
35 un second temps, test6es pour la capacity de 1' insert 
nucl£otidique sSlectionne a stimuler 1* expression du 
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marqueur d' activity de promoteurs lorsque lesdites cellules 
hotes sont phagocytees par des cellules du type 
macrophagique ♦ 

5 De mani&re plus specif ique, on compare la stimulation 

de 1' expression du marqueur d 1 activity de promoteurs chez 
des cellules hotes plac6es en culture ax6nique (cellules 
hotes seulea en culture) 3 la stimulation de 1* expression 
du marqueur d' activity de promoteurs chez des cellules 

10 hStes cultiv6es en presence de macrophages et ainsi 
phagocytics par ces derniers. 

La selection de cellules hotes positives pour le 
marqueur d 1 activity de promoteurs peut Stre realis^e d&s 
15 I'itape e) du proc6de de criblage decrit ci-dessus, ou 
encore apr&s l'une quelconque des Stapes f ) , g) , h) ou i) , 
c'est-S-dire une fois que les cellules hotes ont 6t6 
s61ectionn6es positivement pour le marqueur d' exportation 
et/ou de selection. 

20 

La mise en oeuvre de ce procSde permet la construction 
de banques d'ADN comportant des sequences correspondant £ 
des polypeptides susceptibles d'etre export£s et/ou 
secr6t€s, et/ou susceptibles d'etre induits ou r§prim6s 
25 lors de 1* infection lorsqu'ils sont produits au sein de 
mycobact6ries ' recombinantes . L 1 6 tape i) du procSde peut 
comprendre une etape de s^quengage des insertions 
selectionndes . 

30 De preference, dans le proced§ selon I 1 invention, le 

vecteur utilis6 est choisi parmi les plasmides pJVEDa 
(CNCM, N° 1-1797) ,pJVBDb (CNCM, N° 1-1906), pJVEDc (CNCM, 
N° 1-1799) ou pJVED/M. tuberculosis (CNCM, N°I-1907) , et la 

digestion des sequences d'ADN de mycobact6ries est 
35 effectufee au moyen de 1' enzyme Sau3A. 

Selon un mode de realisation pref£r£ de 1' invention, 
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le proc6d6 de criblage est caract6ris6 en ce que les 
sequences de mycobacteries sont issues d'une mycobacterie 
pathog&ne, par exemple de Af. tuberculosis, M. bovis, M. 
avium, M. africanum ou M. leprae. 

5 

L» invention comprend egalement une banque d'ADN 
gfinomique ou d'ADNc compiementaire d'ARNm de mycobact6rie, 
caract6ris€e en ce qu'elle est obtenue par un proc6d€ 
comprenant les Stapes a)et b) , ou a), b) et c) du proc^de 
10 precedent selon l f invention, de preference une banque d'ADN 
g6nomique ou d'ADNc compiementaire d'ARNm de mycobacteries 
pathogenes, de preference de mycobacteries appartenant au 
groupe du complexe Mycobacterium tuberculosis, de 

preference de Mycobacterium tuberculosis. 

15 

Dans la pr£sente invention, on entend designer par 
"sequences nucleiques" ou "sequences d'acides amines" SEQ 
ID N° X S SEQ ID N° Y, oti X et Y peuvent repr<Ssenter 
independamment un nombre ou un caractSre alphanumSrique, 
20 respectivement 1* ensemble des sequences nucleiques ou 
1* ensemble des sequences d'acides amines representees par 
les figures X ^ Y, extrfemitSs comprises. 

Par exemple, les sequences nucleiques ou les sequences 
25 d'acides amines SEQ ID N° la SEQ ID N° 4N sont 
respectivement les sequences nucleiques ou les sequences 
d'acides amines representees par les figures 1 a 4N, c'est- 
&-dire respectivement les sequences nucleiques ou les 
sequences d'acides amines SEQ ID N° 1, SEQ ID N° 1A» , SEQ 
30 ID N° 1B\ SEQ ID N° 1C 1 , SEQ ID N° ID, SEQ ID N° IF, SEQ 
ID N° 2, SEQ ID N° 3A, SEQ ID N° 3B, SEQ ID N° 3C, SEQ ID 
N° 4A, SEQ ID N° 4B, SEQ ID N° 4C, SEQ ID N° 4A' , SEQ ID N* 
4B\ SEQ ID N° 4C, SEQ ID N° 4F, SEQ ID N° 4J, SEQ ID N° 
4K, SEQ ID N° 4L, SEQ ID N* 4M et SEQ ID N° 4N, 

35 

L' invention a Sgalement pour objet les sequences 
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nucl€otidique£ de mycobactSries ou comprenant des sequences 
nucl£otidiques de mycobact§ries s61ectionn6es aprSs la 
realisation du proc£d£ selon 1* invent ion ci-dessus d6crit. 

5 

De pr£f6rence, ladite mycobact^rie est choisie parmi M* 
tuberculosis, M* bovis, M. africanum, M. avium, M. leprae, 
M. paratuberculosis, M, kansassi ou M. x£nopi, 

10 On pr6fere les sequences nucl6otidiques de mycobact£ries 

ou comprenant une sequence nucl6otidique de mycobact^rie, 
ladite sequence nucl§otidique de mycobacteria 6tant choisie 
parmi les sequences de fragments d'ADN de mycobact£rie de 
sequence nucleique SEQ ID N° 1 a SEQ ID N° 24C, SEQ ID N° 

15 27A a SEQ ID N° 27C, SEQ ID N° 29 et SEQ ID N° 31A a SEQ ID 
N° 50F, respect ivement representees par les figures i 5 24G 
(planches 1 a 150), par les figures 27A S 27C (planches 152 
a 154), par la figure 29 (planche 156) et par les figures 
31A a 50F (planches 158 a 275). 

20 

Selon un mode de realisation particulier de 1' invention, 
des sequences pr6f£rees sont par exemple les fragments 
d'ADN de mycobactSries de sequence SEQ ID N°l, SEQ ID N°3A, 
SEQ ID N°5A, SEQ ID N°6A, SEQ ID N°7A, SEQ ID N°8A, SEQ ID 

25 N*9A, SEQ ID N°10A, SEQ ID N°27A ou SEQ ID N°29 contenus 
respect ivement dans les vecteurs pDP428 (CNCM, N°I-1818), 
p6D7 (CNCM, N°I-1814), p5F6 (CNCM, N°I-1816), p2A29 (CNCM, 
N°I-1817), p5B5 (CNCM, N°I~1819) , plC7 (CNCM, N°I-182G) , 
p2D7 (CNCM,N°I-1821) , plB7(CNCM, N°I-1843) , p5A3 (CNCM, 

30 N°I-1815) et pM!C25 (CNCM, n°I-2062) . 

L 1 invention concerne 6galement un acide nucleique 
comprenant la totalite de la phase de lecture ouverte d'une 
des sequences nucliotidiques selon 1» invention, notamment 
35 une des sequences SEQ ID N° 1 h SEQ ID N° 24C, SEQ ID N° 
27A h SEQ ID N° 27C, SEQ ID N° 29 et SEQ ID N° 31A £ SEQ ID 
N° 50F selon 1' invention. Ledit acide nucleique pent &tre 
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isol6 par exemple de la fagon suivante : 

a) preparation d'une banque de cosmides a partir de I'ADN 
de AT. tuberculosis, par exemple selon la technique d£crite 

5 par Jacobs et al. # 1991; 

b) hybridation de tout ou partie d'un acide nucl6ique 
sonde de sequence choisie par exemple parmi SEQ ID N° 1 J 
SEQ ID N° 24C, SEQ ID N° 27A h SEQ ID N° 27C, SEQ ID N° 29 
et SEQ ID N° 31A £ SEQ ID N° 50F avec leg cosmides de la 

10 banque prSalablement pr6par£e a l'6tape a) ; 

c) selection des cosmides hybridant avec . 1* acide 
nucleique sonde de I'Stape b) ; 

d) s6quen<?age des inserts d'ADN des clones sSlectionnes a 
l'Stape c) et identification du cadre de lecture ouvert 

15 complet ; 

e) le cas 6cheant, clonage des inserts s6quenc6s a 
l'etape d) dans un vecteur d 1 expression et/ou de clonage 
approprie . 

20 Les acides nucl§iques comprenant la totality du cadre de 

lecture ouvert des sequences SEQ ID N p 1 k SEQ ID N° 24C, 
SEQ ID N° 27A k SEQ ID N° 27C, SEQ ID N° 29 et SEQ ID N° 
31A k SEQ ID N° 50F sont parmi les acides nucleiques 
preterms . 

25 

La present e invention permet de determiner un fragment 
de gene codant pour un polypeptide exporte. La comparaison 
avec la sequence du genome publi6e par Cole et al. (Cole et 
al., 1998, Nature, 393, 537-544) permet de determiner le 
30 gdne en entier portant la sequence identifiee selon la 
presente invention. 

Par sequence nucl6otidique comprenant la totality du 
cadre ouvert de lecture d'une sequence selon 1* invention, 
35 on entend la sequence nucl€otidique (g€nomique, ADNc, semi- 
synthfitique ou synthetique) comprenant l'une des sequences 
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selon 1* invention et s'etendant d'une part en 5 1 de ces 
sequences jusqu'au premier codon d' initiation de la 
traduction (ATG ou GTG) ou meme jusqu'au premier codon 
stop, et d 1 autre part en 3' de ces sequences jusqu'au codon 
5 atop suivant, et ceci dans I'une quelconque des trois 
phases de lecture possibles, 

Les sequences nucl6otidiques compiementaires des 
sequences ci-dessus selon 1* invention font egalement partie 
10 de 1' invention, 

Par polynucleotide de sequence complementaire d'une 

sequence nucleotidique selon 1' invention, on entend toute 

sequence d'ADN ou d'ARN dont les nucleotides sont 

15 compiementaires de ceux de ladite sequence selon 
1' invention et dont 1 'orientation est invers^e. 

Les fragments nucieotidiques des sequences ci-dessus 
selon 1' invention notamment utiles en tant que sondes ou 
20 amorces font egalement partie de 1* invention, 

L' invention concerne aussi les polynucleotides 
caracterises en ce qu'ils comprennent un polynucleotide 
choisi parmi : 

25 a) un polynucleotide dont la sequence est complementaire de 
la sequence d'un polynucleotide selon l f invention, 

b) un polynucleotide dont la sequence comporte au moins 50% 
d 1 identite avec un polynucleotide selon 1' invention, 

c) un polynucleotide hybridant dans des conditions de forte 
30 stringence avec une sequence de polynucleotide selon 

1 % invention, 

d) un fragment d'au moins 8 nucleotides consecutifs d'un 
polynucleotide defini selon 1* invention. 

35 Les conditions de forte stringence ainsi que le 

pourcentage d ( identite seront definis ci-aprds dans la 
pr6sente description. 
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10 



20 



35 



Lorsque la sequence codante issue du gene marqueur 
d' exportation et/ou de secretion est une sequence issue du 
gSne phoA, 1 ■ exportation et/ou la s6cretion du produit du 
gene phoA, le cas echeant tronque, n'est obtenue que 
lorsque cette sequence est inseree en phase avec la 
sequence ou element de regulation de 1' expression de la 
production de polynucleotides et sa localisation placee en 
amont, qui contient les elements controlant 1 ' expression, 
1' exportation et/ou la s6cretion issus de sequence de 
mycobacteries . 



Les vecteurs recombinants de 1 1 invention peuvent bien 
entendu comprendre des sites de clonage multiples decales 
15 de un ou deux nucleotides par rapport a un vecteur selon 
1' invention, permettant ainsi d'exprimer le polypeptide 
correspondant au fragment d'ADN de mycobacterie insere et 
susceptible d'etre traduit selon l'un des trois cadres de 
lecture possibles. 



Par exemple les vecteurs preferes pJVEDb et pJVEDc de 
1' invention se distinguent du vecteur prefere pJVEDa par un 
decalage respectif de un et de deux nucleotides au niveau 
25 du site de clonage multiple. 

Ainsi, les vecteurs de 1' invention sont capables 
d'exprimer chacun des polypeptides susceptibles d'etre 
codes par un fragment d'ADN de mycobacterie insere. Cesdits 
30 polypeptides, caracterises en ce qu'ils sont done 
susceptibles d'etre exportes et/ou secretes, et/ou induits 
ou reprimes, ou exprim6s de facon constitutive lors de 
1' infection, font partie de 1' invention. 



On prefere notamment les polypeptides de 1' invention 
dont les sequences d'acides amines sont choisies parmi les 
sequences d'acides amines SEQ ID N« l a SEQ ID N° 24G, SEQ 



WO 99/09186 



PCT/FR98/01813 



23 

ID N° 27A a SEQ ID N° 28 et SEQ ID N° 30 £ SEQ ID N° 50F et 
representees respectivement par les figures 1 a 24C 
(planches 1 a 150), les figures 27A A 28 (planches 152 a 
155) et les figures 30 & 50F (planches 157 a 275) , 

5 

Font figalement partie de 1 * invention, ' les fragments ou 
fragments biologiquement actifs ainsi que les polypeptides 
homologues desdits polypeptides. Fragment, fragment 
biologiquement act if et polypeptides homologue de 
10 polypeptide, £tant tels que d£f inis ci-apres dans la 
description, 

L' invention concerne egalement les polypeptides 
comprenant un polypeptide ou un de leurs fragments selon 
15 l 1 invention* 

L' invention a aussi pour objet des mycobact6ries 
recombinantes contenant un vecteur recombinant selon 
1 1 invention decrit pr6c£demment . Une mycobacterie prefer^e 
20 est une mycobacterie du type M. smeqmaixs , 

M. smegma tie permet avantageusement de tester 
l'efficacite de sequences de mycobacteries, pour le 
contr81e de 1 1 expression, de 1 1 exportation et/ou de la 
secretion, et/ou de I 1 activity de promoteurs d'une sequence 
25 donnfie, par exemple d'une sequence codant pour un marqueur 
tel que la phosphatase alcaline et/ou la lucif erase, 

Une autre mycobacterie pr6f£ree est une mycobacterie du 
type AT. bovis, par exemple la souche BCG utilis£e 
30 actuellement pour la vaccination contre la tuberculose. 

Une autre mycobacterie pr6feree est une souche de M. 
tuberculosis, M. bovis ou M. africanum possedant 
potentiellement tous les syst&mes de regulation appropries. 

35 Les inventeurs ont ainsi caract6ris£ en particulier un 

polynucleotide constitu6 par une sequence de nucleotides 
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pr£sente chez toutes les souches testees de mycobacfc£ries 
appartenant au complexe de Mycobacterium tuberculosis. Ce 
polynucleotide, d^nomme DP428 contient un cadre ouvert de 

lecture (ORF) codant pour un polypeptide d' environ 12 kD, 
5 Le cadre de lecture ouvert (ORF) codant pour le polypeptide 

DP428 s'etend du nucleotide en position nt 941 au 

nucleotide en position nt 1351 de la sequence SEQ ID N° 2, 

le polypeptide DP428 ayant la sequence en acides amines SEQ 

ID N° 28 suivante : 
10 MKTGTATTRRRLLAVLIALALPGAAVALLAEPSATGASDPCAASEVARTVGSVAKSMGD 

YLDSHPETNQVMTAVLQQQVGPGSVASLKAHFEANPKVASDLHALSQPLTDLSTRCSLP 

ISGLQAIGLMQAVQGARR . 

Ce poids moleculaire (PM) correspond au PM theorique de 
15 la proteine mature obtenue apr&s clivage de la sequence 
signale, le PM de la proteine ou polypeptide DP428 etant 
d 1 environ 10 kD aprds ancrage potent iel au pepfcidoglycane 
et coupure potentielle entre S et G du motif LPISG. 

20 Ce polynucleotide inclut, d'une part, un cadre ouvert de 

lecture correspondant a un gene de structure et, d 1 autre 
part, les signaux de regulation de 1' expression de la 
sequence codante en amont et en aval de cette derniSre.Le 
polypeptide DP428 est composi d'un peptide signal, d'une 

25 region centrale hydrophile et d'une region C-terminale 
hydrophobe* Cette derniSre se termine par deux r£sidus 
arginines (R) , signal de retention, et est precede par un 
motif LPISG qui rappelle le motif LPXTG d' ancrage au 
peptidoglycane (Schneewind et al., 1995). 

30 

Par gene de structure aux fins de la prisente invention, 
on entend un polynucleotide codant pour une proteine, un 
polypeptide ou encore un fragment de ces derniers, ledit 
polynucleotide ne comprenant que la sequence correspondant 
35 au cadre ouvert de lecture (ORF) , ce qui exclut les 
sequences du cote 5* du cadre ouvert de lecture (ORF) qui 
dirigent 1» initiation de la transcription. 
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Ainsi, 1' invention concerne en particulier un 
polynucleotide dont la sequence est choisie parmi les 
sequences nucl6otidiques SEQ ID N°l 3 SEQ ID N°2. 

3 

Plus particuli&rement, 1' invention concerne un 
polynucleotide caract6ris6 en ce qu'il comprend un 
polynucleotide choisi parmi : 

10 a) un polynucleotide dont la sequence est choisie parmi les 
sequences nucieotidiques SEQ ID N°l a SEQ ID N°2, 
fo) un polynucleotide dont la sequence nucieique est la 
sequence comprise entre le nucleotide en position nt 964 
et le nucleotide en position nt 1234, extremites indues, 

15 de la sequence SEQ ID N°l, 

c) un polynucleotide dont la sequence est compiementaire de 
la sequence d'un polynucleotide defini en a) ou b) , 

d) un polynucleotide dont la sequence comporte au moins 50% 
d'identite avec un polynucleotide defini en a) f b) ou c) , 

20 e) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide defini en 
a) , b) , c) ou d) , 

f) un fragment d'au moins 8 nucleotides consecutifs d'un 
polynucleotide defini en a) , b) , c) , d)ou e) . 

25 

On enterid par sequence nucieotidique, polynucleotide 
ou acide nucieique, selon la presente invention, aussi bien 
un ADN double brin, un ADN simple brin que des produits de 
transcription desdits ADN, 

30 

Par pourcentage d'identite au sens de la presente 
invention, on entend un pourcentage d'identite entre les 
bases de deux polynucleotides, ce pourcentage etant 
purement statistique et les differences entre les deux 
35 polynucleotides etant reparties au hasard et sur toute 
leur longueur. 
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Une hybridation dans des conditions de forte 
stringence signifie que les conditions de temperature et de 
force ionique sont choisies de telle maniere qu'elles 
permettent le maintien de 1 1 hybridation entre deux 
5 fragments d'ADN compiementaires . 

A titre illustratif, des conditions de forte 
stringence de l'£tape d ' hybridation aux fins de definir les 
fragments polynucl^otidiques decrits ci~dessus, sont 

10 avantageusement les suivantes ; 

1 'hybridation est r6alisee a une temperature 
pr£f erentielle de 65°C, en presence de tampon commercialism 
sous le nom de rapid-hyb buffer par Amersham (RPN 1636) et 
100 /xg/ml d'ADN de E.coli. 

15 Les etapes de lavage peuvent, par exemple, etre les 

suivantes : 

- deux lavages de 10 min, preferentiellement h 65°C, dans 
un tampon 2 x SSC et 0,1% SDS ; 

- deux lavages de 10 min, pr6f £rentiellement a 65°C, dans 
20 un tampon 1 x SSC et 0,1% SDS; 

- un lavage de 10 min, preferentiellement a 65°C, dans un 
tampon de 0,1 x SSC et 0,1% SDS . 

1 x SSC correspond 3 0,15 M NaCl et 0,05M citrate de 
Na et une solution de 1 x Denhardt correspond a 0,02% 
25 Ficoll, 0,02% de polyvinylpyrrolidone et 0,02% de serum 
albumine bovine, 

Avantageusement, un fragment nucl6otidique rSpondant a 
la definition pr6c6dente aura au moins 8 nucleotides, de 

30 preference au moins 12 nucleotides, et encore plus 
preferentiellement au moins 20 nucleotides consecutifs de 
lasequence dont il est issu. Les conditions d* hybridation 
de forte stringence decrites ci-avant pour un 
polynucleotide d'une taille d'environ 200 bases, seront 

35 adaptees par l'homme du metier pour des oligonucleotides de 
taille plus grande ou plus petite, selon 1 1 enseignement de 
Sambrook et al . , 1989. 
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Pour les conditions de mise en oeuvre des enzymes de 
restriction dans le but d'obtenir des fragments 
nucl6otidiques des polynucleotides selon 1' invention, on se 
5 r6f€rera avantageusement a l'ouvrage de Sambrook et al . , 
1989, 

Avantageusement/ un polynucleotide de 1' invention 
contiendra au moins une sequence comprenant 1 • enchainement 
10 de nucleotides allant du nucleotide en position nt 964 au 
nucleotide nt 1234 du polynucleotide de sequence SEQ ID 
N* 1. 

La prfisente invention a pour objet un polynucleotide 
15 selon I 1 invention, caracteris€ en ce que sa sequence 
nucl6ique hybride avec 1'ADN de sequence de mycobact6ries 
et preferentiellement avec 1 1 ADN de sequence de 
mycobact€ries appartenant au complexe de Mycobacterium 

tuberculosis . 

20 

Le polynucleotide est code par une sequence 
polynucl§otidique telle que decrite supra. 

La presents invention a egalernent pour objet un 
25 polypeptide issu d'une mycobact§rie, caract§ris§ en ce 
qu'il est present uniquement chez les mycobacteries 
appartenant au complexe de Mycobacterium tuberculosis, 

L' invention concerne §galement un polypeptide 
30 caract6rise en ce qu'il comprend un polypeptide choisi 
parmi : 

a) un polypeptide dont la sequence d'acides amines est 
comprise dans une sequence d'acides amines choisie parmi 
les sequences d'acides amines SEQ ID N°l a SEQ ID N°24C, 

35 SEQ ID N° 27A k SEQ ID N° 28 et SEQ ID N° 30 a SEQ ID N° 
50F, 

b) un polypeptide homologue au polypeptide def ini en a) , 
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c) un fragment d'au moins 5 acides amines d'un polypeptide 
dEfini en a)ou b) , 

d) un fragment biologiquement act if d'un polypeptide defini 
en a) , b) , ou c) . 

5 

La prEsente invention a aussi pour objet un 
polypeptide dont la sequence d' acides aminGs est comprise 
dans la sequence d' acides amines SEQ ID N°l ou SEQ ID N°2, 
ou un polypeptide de sequence d' acides amines SEQ ID N°28. 

10 

Par polypeptide homologue, on entendra designer les 
polypeptides presentant, par rapport au polypeptide naturel 
selon 1' invention tel que le polypeptide DP4 28, certaines 
modifications comme en particulier une delation, addition 

15 ou substitution d'au moins un acide aminE, une troncation, 
un allongement, une fusion chimErique, et/ou une mutation. 
Parmi les polypeptides homologues, on prEfSre ceux dont la 
sequence d» acides amines prEsente au moins 30%, de 
preference 50%, d'homologie avec les sequences decides 

20 amines des polypeptides selon 1' invention* Dans le cas 
d'une substitution, un ou plusieurs acides aminEs 
consecutifs ou non consEcutifs, sont remplaces par des 
acides amines « Equivalents *. L* expression acide amine 
<k Equivalent » vise ici & designer tout acide amine 

25 susceptible d'etre substitue a l'un des acides amines de la 
structure de base sans cependant modifier essentiellement 
les propriEtEs immunogSnes des peptides correspondants . En 
d'autres termes, les acides amines Equivalents seront ceux 
qui permettent I'obtention d'un polypeptide de sequence 

30 modifiee qui permet 1 1 induction in vivo d'anticorps ou de 
cellules capables de reconnaitre le polypeptide dont la 
sequence decides amines est comprise dans la sequence 
d' acides amines de polypeptide selon l 1 invention, telle que 
les sequences d 1 acides amines SEQ ID N°l a SEQ ID N° 2, ou 

35 un polypeptide de sequence d' acides aminEs SEQ ID N°28 
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(polypeptide DP428) ou l'un de ses fragments ci-dessus 
d£f inis . 

Ces aminoacyles equivalents peuvent etre determines 
soit en s'appuyant sur leur homologie de structure avec les 
5 aminoacyles auxquels ils se substituent, soit sur les 
r6sultats des essais d» immunogenicit6 crois^e auxquels les 
differents peptides sont susceptibles de donner lieu. 

A titre d'exemple, on mentionnera les possibilit6s de 
10 substitutions susceptibles d'etre effectu6ea sans qu*il en 
rSsulte une modification approfondie de 1 1 immunogenicite 
des peptides modifies correspondants, les remplacements, 
par exemple, de la leucine par la valine ou 1 ■ isoleucine, 
de I'acide aspartique par l'acide glutamique, de la 
15 glutamine par 1 • asparagine , de l'arginine par la lysine 
etc., les substitutions inverses 6tant naturellement 
envisageables dans les memes conditions. 

Par fragment biologiquement actif, on entendra 
20 designer en particulier un fragment de sequence d'acides 
amines de polypeptide prSsentant au moins une des 
caracteristiques des polypeptides selon 1' invention, 
nptamment en ce qu'il est : 

capable d'etre export^ et/ou secrete par une 
25 mycobacteria, et/ou d'etre induit ou reprimS lors de 
1» infection par la mycobact£rie ; et/ou 

capable d'induire, de reprimer ou de moduler, 
directement ou indirectement , un facteur de virulence de 
mycobactgrie ; et/ou 
30 capable d'induire une reaction d 1 immunogenicite dirigee 
contre les mycobacteries ; et/ou 

" capable d'gtre reconnu par un anticorps specif ique de 
mycobacteria . 

35 Par fragment de polypeptide, on entend designer un 

polypeptide comportant au minimun 5 acides amines, de 
preference 10 acides amines et 15 acides amines. 
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Un polypeptide de 1' invention, ou un de ses 
fragments, tels que d£finis pr6c6demment , est susceptible 
d'etre reconnu spficif iquement par les anticorps presents 
5 dans le s^rum de patients infect^s par des mycobact6ries et 
prSf£rentiellement des bact6ries appartenant au complexe de 
Mycobacterium tuberculosis ou par des cellules de l*h6te 
infect6. 

Font ainsi partie de l f invention les fragments du 
10 polypeptide dont la sequence d'acides amines est comprise 
dans la sequence d'acides amines de polypeptide selon 
1" invention, telle que les sequences decides amines SEQ ID 
N°l a SEQ ID N°2, ou un polypeptide de sequence d'acides 
amines SEQ ID N°2B, qui peuvent §tre obtenus par clivage 
15 dudit polypeptide par une enzyme proteolytique, telle que 
la trypsine ou la chymotrypsine ou la collag6nase, ou par 
un r€actif chimique, tel que le bromure de cyanogens (CNBr) 
ou encore en pla<?ant un polypeptide selon 1* invention tel 
que le polypeptide DP428 dans un environnement tr&s acide, 
20 par exemple & pH 2,5. Des fragments peptidiques prefSres 
selon I 1 invention, pour une utilisation en diagnostic ou en 
vaccination, sont les fragments contenus dans des regions 
de polypeptide selon 1' invention tel que le polypeptide 
DP428 susceptibles d'etre naturellement expos6es au solvant 
25 et de presenter ainsi des propri6t6s d ' immunog6nicit6 
importante, De tels fragments peptidiques peuvent etre 
pr6par6s indif f 6remment par synthase chimique, S partir 
d'hotes transform^ par un vecteur d* expression selon 
1' invention contenant un acide nucleique permettant 
30 1* expression desdits fragments, placS sous le contrdle des 
§l€ments de regulation et/ou d' expression appropri6s ou 
encore par clivage chimique ou enzymatique. 

Une analyse de 1 1 hydrophilicit6 du polypeptide DP428 a 
35 6te realis6e & I'aide du logiciel DNA Strider™ 
(commercialism par le CEA Saclay) , sur la base d'un calcul 
du caractSre hydrophile de la region codante pour le DP428 



WO 99/09186 



PCT/FR98/01813 



31 

de la SEQ ID N°28. Les resultats de cette analyse sont 
pr£sentes a la figure 54, oil sont detailies, pour chacun 
des acides amines (AA) de position d6finie dans la SEQ ID 
N°28, I'indice d ' hydrophilicite . Plus 1 1 indice 

5 d' hydrophilicite eat 61ev6, plus 1 ' acide amine consider 
est susceptible d'etre expose au solvant dans la molecule 
native, et est en consequence susceptible de presenter un 
degr<§ d' antigenicity eieve. Ainsi, un enchainement d'au 
moins sept acides amines possedant un indice £leve 

10 d' hydrophilicit6 (>0,3) peut constituer la base de la 
structure d'un peptide candidat immunogdne selon la 
pr6sente invention. 

Les r£ponses immunitaires cellulaires de l*hote & un 
15 polypeptide selon 1' invent ion/ peuvent etre mises en 
Evidence selon les techniques decrites par Colignon et al., 
1996. 

D'apres les donn6es de la carte d 1 hydrophilicite 
20 presentee a la Figure 54 , les inventeurs ont pu definir des 
regions du polypeptide DP428 pref erentiellement exposees au 
solvant, plus particulierement la region localisee entre 
les acides amines 55 et 72 de la sequence SEQ ID N° 28 et 
la region localisee entre les acides amines 99 et 107 de la 
25 SEQ ID N° 28, 

Les regions peptidiques du polypeptide DP428 definies 
ci-dessus peuvent etre avantageusement mises en oeuvre pour 
la realisation des compositions immunogenes ou des 
30 compositions vaccinales selon 1' invention. 

Les polynucleotides caracterises en ce qu f ils cedent 
pour un polypeptide selon 1' invention, font egalement 
partie de 1' invention. 

35 

L* invention concerne egalement les sequences d' acide 
nucleique utilisables comme sonde ou amorce, caracterisees 
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en ce que lesdites sequences sont choisies parmi les 
sequences d'acide nucieique de polynucleotides selon 
1 1 invention. 

5 L 1 invention conceme en outre 1 1 utilisation d'une 

sequence d'acide nucieique de polynucleotides selon 
l 1 invention comme sonde ou amorce, pour la detection et/ou 
1' amplification de sequence d'acide nucieique. Parmi ces 
sequences d'acide nucieique selon 1' invention utilisables 

U) comme sonde ou amorce, on pr6fere les sequences d'acide 
nucieique de 1' invention, caract6ris6e en ce que lesdites 
sequences sont des sequences, ou leur sequence 
complementaire, comprises entre le nucleotide en position 
nt 964 et le nucleotide en position nt 1234, extrSmites 

15 indues, de la sequence SEQ ID N°l. 

Parmi les polynucleotides selon 1' invention, 
utilisables comme amorces nucleotidiques, on prefere 
particulierement les polynucleotides de sequence SEQ ID 
20 N°25 et SEQ ID N°26. 

Les polynucleotides selon 1' invention peuvent ainsi 
etre utilises pour selectionner des amorces nucleotidiques, 
notamment pour la technique PGR (Erlich, 1989 ; Innis et 
25 al., 1990, et, Rolfs et al., 1991), 

Cette technique necessite le choix de paires 
d ! oligonucleotides encadrant le fragment qui doit etre 
amplifie. On peut, par exemple, se referer a la technique 

30 decrite dans le brevet americain U.S. N° 4 683 202. Ces 
amorces oligodesoxyribonucieotidiques ou oligoribo- 
nucleotidiques ont avantageusement une longueur d'au moins 
8 nucleotides, de preference d'au moins 12 nucleotides, et 
encore plus preferentiellement au moins 20 nucleotides. On 

35 preferera en particulier des amorces d'une longueur 
comprise entre 8 et 30 et de preference 12 et 22 
nucleotides. L'une des deux amorces est compiementaires du 
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brin {+) [amorce aller] de la matrice et 1' autre amorce est 
compl6mentaire du brin (-) [amorce re tour] . II est 
important que les amorces ne possedent pas de structure 
secondaire ou de sequence complEmentaire I'une de 1* autre. 

5 D 1 autre part, la longueur et la sequence de chaque amorce 
doivent etre choisies de manidre 3 ce que les amorces ne 
s'hybrident pas avec d'autres acides nucl£iquea provenant 
de cellules procaryotes ou eucaryotes, en particulier avec 
les acides nuclEiques provenant d'autres mycobactdries 

10 pathog&nes, ni avec l'ADN ou 1 1 ARN humain pouvant 
eventuellement contaminer 1 'echantillon biologique. 

Les rEsultats prSsentes d la figure 51, montrent que 
la sequence codant pour le polypeptide DP428 (SEQ ID N° 28) 
15 n*est pas retrouvEe dans les ADNs de NL fortui turn, M. 
simiae, M. avium, M< chelonae, Ni . flavescens, M . gordonae, 
M- marinum et M. kansasii 

Les fragments amplifies peuvent etre identifies apres 
20 une electrophorese en gel d' agarose ou de polyacrylamide, 
ou apr£s une Electrophorese capillaire, ou encore apres une 
technique chromatographique (filtration sur gel, 
chromatographic hydrophobe ou chromatographie Echangeuse 
d'ions). La specificite de 1 1 amplification peut etre 
25 contrdlEe par hybridation moleculaire en utilisant comme 
sondes les sequences nuclEotidiques de polynucleotides de 
l 1 invention, des plasmides contenant ces sequences ou leurs 
produits d' amplification. 

30 Les fragments nucleotidiques amplifies peuvent etre 

utilises comme rSactifs dans des reactions d 1 hybridation 
afin de mettre en Evidence la presence, dans un echantillon 
biologique, d'un acide nuclEique cible de sequence 
complementaire a celle desdits fragments nucleotidiques 

35 amplifies. 
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Parmi les polynucl6otides selon 1' invention, 
utilisables comme sondes nucl6otidiques, on prefere tout 
particuli^reroent le fragment polynuclfiotidique comprenant 
la sequence comprise entre le nucleotide en position nt 964 
5 et le nucleotide en position nt 1234, extr6mit<§s indues, 
de la sequence de SEQ ID N°l. 

Ces sondes et amplicons peuvent etre marques ou non 
par des elements radioactifs ou par des molecules non 
10 radioactives, telles que des enzymes ou des elements 
f luorescents. . 

L* invention vise 6galement les fragments 
nucleotidiques susceptibles d'etre obtenus par 

IS amplification & l'aide d' amorces selon 1' invention. 

D'autres techniques d» amplification de I'acide 
nucleique cible peuvent etre avantageusement employees 
comme alternatives & la PCR. 

20 La technique SDA (Strand Displacement Amplification) 

ou technique d 1 amplification & d6placement de brin (Walker 
et al., 1992) est une technique d' amplification isotherme 
dont le principe est fonde sur la capacity d'une enzyme de 
restriction de couper l'un des deux brins de son site de 

25 reconnaissance qui se trouve sous une forme 

# 

hemiphosphorothioate et sur la propri6t6 d'une ADN 
polymerase d'initier la synthase d'un nouveau brin d 1 ADN £ 
partir de l 1 extremity 3'0H cr66e par 1* enzyme de 
restriction et de deplacer le brin pr£alablement synth6tis6 

30 qui se trouve en aval. 

Les polynucleotides de I 1 invention, en particulier les 
amorces selon l 1 invention, peuvent egalement etre mis en 
oeuvre dans d'autres procfides d' amplification d'un acide 
nuclfeique cible , tels que : 

35 - la technique TAS (Transcription-based Amplification 
System), dicrite par Kwoh et al * en 1989; 
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- la technique 3SR (Self -Sustained Sequence Replication), 
d<§crite par Guatelli et al. en 1990; 

la technique NASBA (Nucleic Acid Sequence Based 
Amplification), decrite par Kievitis et al. en 1991; 
5 - la technique TMA (Transcription Mediated Amplification) t 
Les polynucleotides de 1' invention peuvent aussi etre 
employ6s dans des techniques d • amplification ou de 
modification de l'acide nucl^ique servant de sonde, telles 
que; 

10 - la technique LCR (Ligase Chain Reaction) , decrite par 
Landegren et al. en 1988 et perf ectionnee par Barany et al. 
en 1991 , qui emploie une ligase thermostable; 

- la technique de RCR (Repair Chain Reaction) , decrite par 
Segev en 1992; 

15 - la technique CPR (Cycling Probe Reaction) , decrite par 
Duck et al. en 1990; 

- la technique d'amplif ication a la Q-beta-replicase, 
decrite par Miele et al. en 1983 et perf ectionnee notamment 
par Chu et al . en 1986, Lizardi et al . en 1988, puis par 

20 Burg et al . ainsi que par Stone et al . en 1996. 

Dans le cas oOt le polynucleotide cible a d£tecter est 
un ARN, par exemple un ARNm, on utilisera avantageusement , 
prealablement a la mise en oeuvre d'une reaction 

25 d* amplification & I 1 aide des amorces selon 1' invention ou a 
la mise en oeuvre d*un proc6de de detection a I'aide des 
sondes de 1* invention, une enzyme de type transcriptase 
inverse afin d'obtenir un ADNc a partir de l'ARN contenu 
dans l^chantillon biologique. L' ADNc obtenu servira alors 

30 de cible pour les amorces ou les sondes mises en oeuvre 
dans le procede d' amplification ou de detection selon 
1' invention. 

La sonde de detection sera choisie de telle mani&re & 
35 ce qu'elle hybride avec l'amplicon g6nere. Une telle sonde 
de detection aura avantageusement pour sequence une 
sequence d'au moins 12 nucleotides, en particulier d'au 
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moins 15 nucleotides, et de preference au moins de 200 
nucleotides . 

Les sondes nucl£otidiques selon 1' invention sont 
capables de dStecter des mycobacteries et 

5 preferentiellement des bactSries appartenant au complexe de 
Mycobacterium tuberculosis, plus pr6cisement du fait que 
ces mycobactSries poss&dent dans leur genome au moins une 
copie de polynucleotides selon 1' invention. Ces sondes 
selon 1" invent ion, sont capables, par exemple, de 

10 s'hybrider avec la sequence nucleotidique d"un polypeptide 
selon 1» invention, plus particulierement tout 
oligonucleotide hybridant avec la sequence SEQ ID N°l 
codant pour le polypeptide DP4 28 de M. tuberculosis, et ne 
prSsentant pas de reaction d ' hybridation crois£e ou 

15 d» amplification (PCR) avec par exemple des sequences 
presentes chez des mycobacterias n 1 appartenant pas au 
complexe de Mycobacterium tuberculosis, Les sondes 
nucl£otidiques selon 1' invention hybrident specif iquement 
avec une molecule d'ADN ou d 1 ARN de polynucleotide selon 

20 1' invention, dans des conditions d 1 hybridation de forte 
stringence telles que donnees sous forme d» exemple 
precedemment . 

Les sequences non marquees peuvent §tre utilisSes 
25 directement comme sondes, cependant les sequences sont 
g6neralement marquees par un element radioactif ("p, 55 3, 
3 H, U5 I) ou par une molecule non-radioactive (biotine, 
acetylaminof luorSne , digoxig£nine , 5 -bromo-d6soxyuridine , 
fluoresceine) pour obtenir des sondes utilisables pour de 
30 nombreuses applications. 

Des exemples de marquages non radioactifs de sondes 
sont decrits, par exemple, dans le brevet frangais N° 
78.10975 ou par Urdea et al. ou par Sanchez - Pescador et al. 
35 en 1988. 
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Dans ce dernier cas, on pourra aussi utiliser l'une 
des mSthodes de marquage d£crites dans les brevets FR 2 422 
956 et FR 2 518 755, La technique d 1 hybridation pe ut etre 
r€alis<§e de manures diverses (Matthews et al . , 1988). La 

5 mfithode la plus g6n6rale consiste 3 immobiliser l'acide 
nucleique extrait des cellules de mycobactSries sur un 
support (tel que nitrocellulose, nylon, polystyrdne) et 3 
incuber, dans des conditions bien ddfinies, l'acide 
nucleique cible immobilise avec la sonde. Apr6s 

10 1' hybridation, 1'exces de sonde est 61imin£ et les 
molecules hybrides formSes sont d£tect£es par la mSthode 
approprige (mesure de la radioactivity, de la fluorescence 
ou de l'activite enzymatique liee a la sonde). 

15 Avantageusement , les sondes nucl6otidiques marquees 

selon 1' invention peuvent avoir une structure telle 
qu'elles rendent possible une amplification du signal 
radioactif ou non-radioact if . Un systeme d • amplification 
repondant a la definition ci-dessus comprendra des sondes 

20 de detection sous la forme d'un ADN ramifie, branche 
(^branched DNA») telles que celles decrites par Urdea et 
al. en 1991. Selon cette technique, on utilisera avanta- 
geusement plusieurs types de sondes notamment une sonde de 
capture, afin d' immobiliser 1 1 ADN ou l'ARN cible sur un 

25 support, et une sonde de detection. La sonde de detection 
lie un ADN «branche» presentant une structure ramifiee. 
L 1 ADN branch^, k son tour, est capable de fixer des sondes 
oligonucleotidiques qui sont elles-memes couplers a des 
molficules de phosphatase alcaline. Puis 1' activity de cette 

30 enzyme est mise en evidence grace a un substrat chimio- 
luminescent, par exemple un derivg du dioxetane -phosphate . 

Selon un autre mode avantageux de mise en oeuvre des 
sondes nuclSiques selon 1' invention, ces dernieres peuvent 
35 etre immobilisees sur un support, de maniere covalente ou 
non covalente, et utilisees comme sondes de capture. Dans 
ce cas, une sonde, dite «sonde de captures, est immobilis^e 
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sur un support et sert a capturer par hybridation sp6ci- 
fique l'acide nucleique cible obtenu a partir de l'6chan- 
tillon biologique a tester. Si necessaire, le support 
solide est s£par£ de 1 1 echantillon et le duplex forme entre 
5 la sonde de capture et l'acide nucleique cible est ensuite 
detecte grSce a une seconde sonde, dite «sonde de 
detection*, marquee par un element facilement detectable. 

Les fragments oligonucl6otidiques peuvent etre obtenus 
10 a partir des sequences selon 1' invention, par coupure avec 
des enzymes de restriction, ou par synthese chimique selon 
les methodes classiques, par exemple selon la methods 
decrite dans le brevet europeen N° EP-0305929 (Millipore 
Corporation) ou encore par d'autres precedes. 
15 Un mode de preparation approprie des acides nucleiques 

de I 1 invention comportant au maximum 200 nucleotides {ou 
200 pb s'il s'agit d' acides nucleiques bicat£naires) 
comprend les Stapes suivantes : 

- la synthese d 1 ADN en utilisant la met node automatisee des 
20 beta-cyanethylphosphoramidite decrite en 1986, 

- le clonage des acides nucleiques ainsi obtenus dans un 
vecteur approprie et la recuperation des acides nucleiques 
par hybridation avec une sonde appropriSe. 

Un mode de preparation, par voie chimique, d' acides 
25 nucleiques selon X 1 invention de longueur supfirieure & 200 
nucleotides (ou 200 pb lorsqu'il s'agit d' acides nucleiques 
bicatenaires) comprend les etapes suivantes : 

- 1 'assemblage d' oligonucleotides synthetises chimiquement , 
pourvus a leur extremite de sites de restrictions 

30 differents, dont les sequences sont compatibles avec 
1 ' enchainement en acides amines du polypeptide naturel 
selon le principe decrit en 1983, 

- le clonage des acides nucleiques ainsi obtenus dans un 
vecteur approprie et la recuperation des acides nucleiques 

35 recherches par hybridation avec une sonde appropriee. 
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Les sondes nucl6otidiques utilisfies pour la 
recuperation des acides nucl6iques recherch£s dans les 
proc£d6s sus-mentionn6s, sont const itu6es g£n6ralement de 8 
a 200 nucleotides de la sequence de polypeptide selon 
5 1* invention et sont susceptibles de s'hybrider avec l'acide 
nucl6ique recherch6 dans les conditions d' hybridation 
d6finies precfidemment . La synthase de ces sondes peut etre 
e£fectu6e selon la m6thode automatis6e des b6ta 
cyanethylphosphoramidites decrite en 1986. 

I() 

Les sondes oligonucleotidiques selon l 1 invention 
peuvent etre mises en oeuvre au sein d'un dispositif de 
detection comprenant une banque matricielle 

d 1 oligonucleotides* Un exemple de realisation d'une telle 
15 banque matricielle peut consister en une matrice 
d' oligonucleotides sondes £ix6s sur un support, la sequence 
de chaque sonde d'une longueur donn6e etant situ£e en 
dScalage d'une ou plusieurs bases par rapport a la sonde 
precedente, chacune des sondes de 1 1 arrangement matriciel 
20 etant ainsi complementaire d'une sequence distincte de 
1 1 ADN ou I'ARN cible £ detecter et chaque sonde de sequence 
connue §tant fixee en une position prfedeterminee du 
support. La sequence cible a detecter peut etre 
avantageusement marquee radioactivement ou non 
25 radioactivement, Lorsque la sequence cible marquee est mise 
en contact avec le dispositif matriciel, celle-ci forme des 
hybrides avec les sondes de sequences complementaires. Un 
traitement k la nuclease, suivi d'un lavage, permet 
d'eliminer les hybrides sondes -sequence cible qui ne sont 
30 pas parfaitement complementaires . Du fait de la 
connaissance precise de la sequence d'une sonde £ une 
position d6termin£e de la matrice, il est alors possible de 
deduire la sequence nucl€otidique de la sequence d 1 ADN ou 
d'ARN cible. Cette technique est particuli^rement efficace 
35 lorsque sont utilisees des matrices de sondes 
oligonucleotidiques de grande taille. 
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Une alternative ei 1 ' utilisation d'une sequence cible 
marquee peut consister en 1 'utilisation d'un support 
permettant une detection « bioelectronique » de 
1 1 hybridation de la sequence cible sur les sondes du 

5 support matr ice, lorsque que ledit support est constitu£ ou 
comprend un mat6riau capable d'agir, par exemple, en tant 
que donneur d*61ectrons aux positions de la mat rice 
auxquelles un hybride a 6t6 form£, Un tel matfiriau donheur 
d 1 Electron est par exemple de l'or. La detection de la 

10 sequence nucleotidique de l'ADN ou ARN cible est alors 
determinee par un dispositif electronique . 

Un exemple de realisation d'un biocapteur, tel que 
d6fini ci-dessus, est d£crit dans la demande de brevet 
15 europ£en N° EP-0721 016 au nom de Affymax technologies N.V, 
ou encore dans le brevet am^ricain N° US 5.202.231 au nom 
de Drmanac. 

L 1 invention a aussi pour objet les polynucleotides 
hybrides resultant : 
20 - soit de la formation d'une molecule hybride entre un ARN 
ou un ADN (ADN genomique ou ADNc) provenant d'un 
6chantillon biologique avec une sonde ou une amorce selon 
1 1 invention. 

- soit de la formation d'une molecule hybride entre un ARN 
25 ou un ADN (ADN genomique ou ADNc) provenant d'un 
fichantillon biologique avec un fragment nucleotidique 
amplifiS 3 1'aide d'un couple d' amorces selon 1' invention. 

Par ADNc au sens de la presents invention* on entend 
une molicule d'ADN obtenue en faisant agir une enzyme de 
30 type transcriptase inverse sur une molecule d'ARN, en 
particulier une molecule d 1 ARN messager (ARNm) , selon les 
techniques decites dans Sambrook et al . en 1989. 

La presente invention a egalement pour objet une 
famille de plasmides recombinants, caracterisSs en ce 
35 qu'ils contiennent au moins une sequence nucleotidique de 
polynucleotide selon 1' invention. Selon un mode de 
realisation avantageux dudit plasmide, il comprend la 
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sequence nucleotidique SEQ ID N°l ou un fragment de celle- 
ci. 

Un autre objet de la pr£sente invention est un vecteur 
pour le clonage, 1 1 expression et/ou 1* insertion d'une 

5 s6quence, caract6ris£ en ce qu'il comprend une sequence 
nucleotidique de polynucleotide selon 1' invention en un 
site non essentiel pour sa replication, le cas 6ch6ant sous 
le controle d ! 61£ments de regulation susceptibles 
d'intervenir dans 1' expression du polypeptide DP428, chez 

It) un hdte determine. 

Des vecteurs particuliers sont par exemple des 
plasmides, des phages, des cosmides, des phagemides, des 
YAC. 

Ces vecteurs sont utiles pour transformer des cellules 
15 h6tes afin de doner ou d'exprimer les sequences 
nuclSotidiques de 1 1 invention . 

L 1 invention comprend egalement les cellules botes 
transform6es par un vecteur selon 1' invention. 

20 

De preference, les cellules botes sont transform£es 
dans des conditions permettant 1' expression d'un 
polypeptide recombinant selon 1* invention. 

25 Une cellules h6te pref£ree selon 1" invention est la 

souche E> coli transformSe par le plasmide pDP428 deposS le 
28 janvier 1997 S la CNCM sous le N°I-1818 ou transform^ 
par le plasmide pMlC25 depose le 4 aout 1998 a la CNCM sous 
le n° 1-2062 ou une mycobactferie appartenant a une souche 

30 de M. tuberculosis, M.hovia ou M.africanum possedant 

potentiellement tous les systemes de regulation appropri£s. 

II est aujourd'hui facile de produire des prot£ines ou 
polypeptides en quantite relativement importante par genie 
genfitique en utilisant comme vecteurs d' expression des 
35 plasmides, des phages, des phagemides* Tout ou partie du 
gene DP428, ou tout polynucleotide selon 1' invention, peut 

etre insere dans un vecteur d* expression approprie pour 
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produire in vitro un polypeptide selon 1 1 invention, 

notamment le polypeptide DP428. Ledit polypeptide pourra 
£tre fixe sur une microplaque pour developper un test 
sfirologique destine k rechercher, dans un but de 
5 diagnostic, le3 anticorps sp^cifiques chez les patients 
atteints de tuberculose . 

Ainsi, la pr£sente invention concerne un proc6d6 de 
preparation d'un polypeptide, caract^rise en ce qu*il met 
10 en oeuvre un vecteur selon 1' invention. Plus 
particulierement l f invention concerne un procede de 
preparation d'un polypeptide de l 1 invention comprenant les 
Stapes suivantes : 

- le cas £ch6ant, 1 1 amplification pr£alable suivant la 
15 technique PGR de la quantity de sequences de nucleotides 
codant pour ledit polypeptide & l'aide de deux amorces 
d'ADN choisies de maniere a ce que I'une de ces amorces 
soit identique aux 10 a 25 premiers nucleotides de la 
sequence nucieotidique codant pour ledit polypeptide, 
20 tandis que 1' autre amorce est complementaire des 10 a 25 
derniers nucleotides (ou s'hybride avec ces 10 k 25 
derniers nucleotides) de ladite sequence nucieotidique, ou 
inversement de maniere S ce que 1 1 une de ces amorces soit 
identique aux 10 a 25 derniers nucleotides de ladite 
25 sequence, tandis que 1 1 autre amorce est complementaire des 
10 a 25 premiers nucleotides (ou s'hybride avec les 10 a 25 
premiers nucleotides) de ladite sequence nucieotidique, 
suivie de 1 1 introduction desdites sequences ainsi 
amplifiees dans un vecteur approprie, 
30 - la mise en culture , dans un milieu de culture approprie, 
d ! un h6te cellulaire prealablement transforme par un 
vecteur approprie contenant un acide nucieique selon 
1* invention comprenant la sequence nucieotidique codant 
pour ledit polypeptide, et 
35 la separation, a partir du susdit milieu de culture, 

dudit polypeptide produit par ledit h6te cellulaire 
transforme * 
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L' invention a aussi pour objet un polypeptide 
susceptible d'etre obtenu par un proc£d6 de l 1 invention tel 
que dScrit pr6c£demment * 

5 Les peptides selon l 1 invention peuvent 6galement etre 

pr6par6s par les techniques classiques, dans le domaine de 
la synthese des peptides. Cette synthase peut Stre r6alis6e 
en solution homogene ou en phase solide. 

Par exemple, on aura recours a la technique de 

!() synthase en solution homogdne decrite par Houbenweyl en 
1974. 

Cette methode de synthese consiste a condenser 
success ivement deux-ci-deux les aminoacyles successifs dans 
15 l f ordre requis, ou a condenser des aminoacyles et des 
fragments pr£alablement formes et contenant dej^ plusieurs 
aminoacyles dans l'ordre appropri£, ou encore plusieurs 
fragments pr£alablement ainsi prepares, etant entendu que 
I 1 on aura eu soin de proteger au prealable toutes les 
20 fonctions react ives portees par ces aminoacyles ou 
fragments, 3 l f exception des fonctions amines de l'un et 
carboxyles de 1' autre ou vice -versa, qui doivent 
normalement intervenir dans la formation des liaisons 
peptidiques, notamment aprds activation de la fonction 
25 carboxyle, selon les methodes bien connues dans la synthase 
des peptides. En variante, on pourra avoir recours a des 
reactions de couplage mettant en jeu des reactifs de 
couplage classique, du type carbodiimide, tels que par 
exemple la l-6thyl-3M3-dim£thyl-aminopropyl) -carbodiimide . 
30 Lorsque l'aminoacyle mis en oeuvre possSde une 

fonction acide supplementaire (notamment dans le cas de 
1' acide glutamique) , ces fonctions seront protegees, par 
exemple par des groupes t~butylester , 

Dans le cas de la synthase progressive, acide amin6 
35 par acide aminfi, la synthese debute de pr6f6rence par la 
condensation de 1 ' amino-acide C- terminal avec l'aminoacide 
qui correspond a l'aminoacyle voisin dans la sequence 
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d€siree et ainsi de suite, de proche en proche, jusqu'a 
1' acide amin6 N- terminal. 

Selon une autre technique pref£r6e de 1' invention, on 
a recours d celle d6crite par Merrifield. 

5 Pour fabriquer une chaine peptidique selon le proc6de 

de Merrifield, on a recours a une r£sine polym&re tres 
poreuse, sur laquelle on fixe le premier acide aming C- 
terminal de la chaine. Cet acide amine est fix6 sur la 
rSsine par 1 1 interm£diaire de son groupe carboxylique et sa 

10 fonction amine est prot6g£e, par exemple par le groupe t- 
butyloxycarbonyle . 

Lorsque le premier acide amin6 C-terminal est ainsi 
fixe sur la r6sine, on enldve le groupe protect eur de la 
15 fonction amine en lavant la r6sine avec un acide ♦ 

Dans le cas ou le groupe protecteur de la fonction 

amine est le groupe t-butyloxycarbonyle , il peut etre 

61imine par traitement de la r<§sine a I'aide d' acide 
20 trif luoroac£tique . 

On couple ensuite le deuxieme acide amine qui fournit 
le second aminoacyle de la sequence recherch6e, & partir du 
residu aminoacyle C-terminal sur la fonction amine 
25. d6prot§g§e du premier acide amine C-terminal fix£ sur la 
chaine. De pr£f§rence, la fonction carboxyle de ce deuxieme 
acide amin6 est activ^e, par exemple par la 
dicyclohexylcarbodiimide, et la fonction amine est 
protegee, par exemple par le t-butyloxycarbonyle. 
30 On obtient ainsi la premiere partie de la chaine 

peptidique recherch6e, qui comporte deux acides amines, et 
dont la fonction amine terminale est protegee. Comme 
prScedemment , on d£prot&ge la fonction amine et on peut 
ensuite proc£der a la fixation du troisifeme aminoacyle, 
35 dans des conditions analogues a celles de l 1 addition du 
deuxieme acide aminfe C-terminal. 
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On fixe ainsi, les uns apres les autres, les acides 
amines qui vont constituer la chaine peptidique sur le 
groupe amine chaque fois d6proteg£ au pr^alable de la 
portion de la chaine peptidique deja form€e, et qui est 
5 rattachSe k la r^sine, 

Lorsque la totality de la chaine peptidique d£siree 
est form6e, on ^limine les groupes protecteurs des 
diff§rents acides amines constituant la chaine peptidique 
et on d£tache le peptide de la rSsine, par exemple a l'aide 
10 decide f luorhydrique . 

De mani&re pr6f erentielle, lesdits polypeptides 
susceptibles d'etre obtenus par un proced£ de 1* invention 
tel que d^crit precedemment comprendront une region exposfie 
15 au solvant et auront une longueur d'au moins 20 acides 
amines . 

Selon un autre mode de realisation de 1' invention, 
lesdits polypeptides sont specifiques de mycobact6ries du 
20 complexe Mycobacterium tuberculosis et ne sont done pas 

reconnus par des anticorps specifiques d 1 autres proteines 
de mycobact6ries . 

L * invention est en outre relative a des polypeptides 
25 hybrides pr6sentant au moins un polypeptide selon 
1" invention et une sequence d'un polypeptide susceptible 
d'induire une reponse immunitaire chez l'homme ou 1' animal. 

Avantageusement , le determinant antigSnique est tel 
qu'il est susceptible d'induire une reponse humorale et/ou 
30 cellulaire. 

Un tel determinant pourra comprendre un polypeptide 
selon 1' invention sous forme glycosylee utilise en vue 
d'obtenir des compositions immunogenes susceptibles 
35 d'induire la synthase d 1 anticorps diriges contre des 
Epitopes multiples. Lesdits polypeptides glycosyl£s font 
6galement partie de 1' invention. 
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Ces molecules hybrides peuvent etre constitutes en 
partie d'une molecule porteuse de polypeptide selon 
I 1 invention associ^e a une partie, en particulier un 
Epitope de la toxine dipht£rique, la toxine t£tanique, un 
5 antigdne de surface du virus de 1' hepatite B (brevet FR 79 
21811), 1 ' antigene VP1 du virus de la poliomy^lite ou toute 
autre toxine ou antigene viral ou bact£rien. 

Avantageusement , ledit determinant antig6nique 
It) correspond a un determinant antigenique de proteines 
immunogenes de 45/47 kD de Af. tuberculosis (demande 

internationale PCT/FR 96/0166), ou encore s£lectionn6es par 
exemple parmi ESAT6 (Harboe et al . , 1996, Andersen et al . , 
1995, et Sorensen et al . , 1995) et DES (PCT/FR 97/00923, 
15 Gicquel et al.). 

Un antigene viral, tel que d6fini ci-dessus, sera 
preferentiellement une proteine de surface ou d'enveloppe 
d'un virus de 1' hepatite, par exemple la proteine de 
20 surface de 1' hepatite B sous 1 1 une de ses formes S, S- 
preSl, S-pr£S2 ou S-preS2-preSl ou encore une proteine d'un 
virus de 1' hepatite A, ou d'une h6patite non-A, non-B, tel 
qu'un virus de 1* hepatite C, E ou delta. 

25 Plus particulidrement , un antigene viral tel que 

defini ci-dessus sera tout ou partie de l*une des 
glycoprot6ines cod6es par le g6nome du virus HIV-1 (brevets 
GB 8324800, BP 84401834 ou EP 85905513) ou du virus H1V-2 
(EP 87400151), et en particulier tout ou partie d'une 

30 protSine select ionnee parmi gag, pol, nef ou env de HIV-l 
ou de HIV- 2. 

Les procedSs de synthase des molecules hybrides 
englobent les mfethodes utilises en genie g6n6tique pour 
35 construire des polynucl6otides hybrides codant pour les 
sequences polypeptidiques recherchtes. On pourra, par 
exemple, se ref£rer avantageusement & la technique 
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d'obtention de gSnes codant pour des prolines de fusion 
decrite par Minton en 1984. 

Lesdits polynucleotides hybrides codant pour un 
5 polypeptide hybride ainsi que les polypeptides hybrides 
selon 1' invention caract6ris6s en ce qu'il s'agit de 
proteines recombinantes obtenues par 1' expression desdits 
polynucleotides hybrides, font 6galement partie de 
1 1 invention. 

10 

Les polypeptides selon l 1 invention peuvent 
avantageusement etre mis en oeuvre dans un proc£de pour la 
detection in vitro d* anticorps dirig6s contre lesdits 

polypeptides, notamment le polypeptide DP428, et ainsi 
15 d'anticorps diriges contre une bacterie du complexe 
Mycobacterium tuberculosis , dans un echantillon biologique 

(tissu ou fluide biologique) susceptible de les contenir, 
ce procede comprenant la mise en contact de cet echantillon 
biologique avec un polypeptide selon 1' invention dans des 
20 conditions permettant une reaction immunologique in vitro 
entre ledit polypeptide et les anticorps eventuellement 
presents dans 1' echantillon biologique, et la mise en 
evidence in vitro des complexes ant igene- anticorps 

eventuellement formes. 

Les polypeptides selon 1' invention peuvent egalement 
et avantageusement etre mis en oeuvre dans un procede pour 
la detection d'une infection par une bacterie du complexe 
Mycobacterium tuberculosis dans un mammifere bas£ sur la 

30 detection in vitro d'une reaction cellulaire indiquant une 

sensibilisation prealable du mammifere audit polypeptide 
comme par exemple la proliferation cellulaire, la synthese 
de proteines telles que 1' interferon gamma. Ce procede pour 
la detection d'une infection par une bacterie du complexe 
35 Mycobacterium tuberculosis dans un mammifere, est 
caracterise en ce qu'il comprend les Stapes suivantes : 
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a) preparation d'un £chantillon biologique contenant des 
cellules dudit mammifere plus particuli£rement des cellules 
du syst&me immunitaire dudit mammifere et plus 
particulierement encore des cellules T ; 
5 b) incubation de 1 1 €chantillon biologique de l'dtape a) 
avec un polypeptide selon 1' invention; 

c) detection d'une reaction cellulaire indiquant une 
sensibilisation prfialable du mammifdre audit polypeptide 
comme par exemple la proliferation cellulaire et/ou la 
10 synthase de proteines telles que 1 1 interferon gamma. 

La proliferation cellulaire pourra etre mesuree, par 
exemple par incorporation de ^-Thymidine. 

Font 6galement partie de 1' invention, les precedes de 
15 detection d'une reaction d'hypersensibilit6 retardee (DTH) , 
caracterises en ce qu'ils mettent en oeuvre un polypeptide 
selon 1 1 invention , 

De pr£f£rence, 1 ' 6chantzillon biologique est constitue 
20 par un fluide, par exemple un serum humain ou animal , du 
sang, des biopsies, le liquide broncho-alveolaire ou le 
liquide pleural, 

Toute procedure classique peut etre mise en oeuvre 
25 pour realiser une telle detection. 

A titre d* exemple, une methode pref6r6e met en jeu des 
processus immunoenzymatiques selon la technique ELISA, par 
immunofluorescence, ou radio- immunologique (RIA) ou 
30 equivalent. 

Ainsi, l 1 invention concerne egalement les polypeptides 
selon I 1 invention, marqu€s a l'aide d'un marqueur adequat 
tel que du type enzymatique, fluorescent, radioactif. 
35 De telles methodes comprennent par exemple les 6tapes 

suivantes ; 
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depot de quantities determinees d'une composition 
polypeptidique selon 1' invention dans les puits d'une 
plaque de microtitration, 

- introduction dans lesdits puits de dilutions croissantes 
5 de s6rum, ou d'echantillon biologique autre tel que defini 

pr£c6demment , devant etre analyst, 

- incubation de la microplaque, 

introduction dans les puits de la plaque de 
microtitration d' anticorps marques dirig6s contre des 

10 immunoglobu lines humaines ou animales, le marquage de ces 
anticorps ayant §t6 rfialisfi a l'aide d'une enzyme 
selectionn6e parmi celles qui sont capables d'hydrolyser un 
substrat en modifiant 1' absorption des radiations de ce 
dernier, au moins a une longueur d'onde d6termin6e, par 

15 exemple a 550 nm, 

- detection, en comparaison avec un tSmoin de contr61e, de 
la quantite de substrat hydrolys€. 

L' invention concerne egalement un necessaire ou kit 
20 pour le diagnostic in vitro d'une infection par une 
mycobactSrie appartenant au complexe Mycobacterium 

tuberculosis, comprenant : 

- un polypeptide selon 1* invention, 

- le cas 6cheant les r^actifs pour la constitution du 
25 milieu propice a la reaction immunologique ou specif ique, 

les r6acti£s permettant la detection des complexes 
antigSne-anticorps produits par la reaction immunologique 
fiventuellement presents dans 1 'Ischantillon biologique, et 
la mise en 6vidence in vitro des complexes antigSne- 

30 anticorps Sventuellement formes, ces r£actifs pouvant 
6galement porter un marqueur, ou etre susceptibles d'etre 
reconnus & leur tour par un r£actif marque, plus 
particulierement dans le cas oil le polypeptide selon 
1' invention n'est pas marque, 

35 - le cas 6ch6ant, un Schantillon biologique de reference 
(temoin n§gatif) depourvu d' anticorps reconnus par un 
polypeptide selon 1» invention, 
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- le cas §ch6ant, un e'chantillon biologique de reference 
{tSmoin positif) contenant une quantite pr£d6termin€e 
d'anticorps reconnus par un polypeptide selon 1' invention, 

5 Les polypeptides selon 1' invention permettent de 

preparer des anticorps monoclonaux ou polyclonaux 
caract£ris§s en ce qu'ils reconnaissent 9p6cif iquement les 
polypeptides selon 1» invention. Les anticorps monoclonaux 
pourront avantageusement §tre pr6par6s & partir 

10 d'hybridomes selon la technique dScrite par Kohler et 
Milstein en 1975. Les anticorps polyclonaux pourront etre 
prepares, par exemple par immunisation d'un animal, en 
particulier une souris, avec un polypeptide selon 
1' invention associe a un adjuvant de la rfiponse 

!5 immunitaire, puis purification des anticorps sp6cifiques 
contenus dans le s6rum des animaux immunises sur une 
colonne d'affinit6 sur laquelle a prfealablement 6t6 fixe le 
polypeptide ayant servi d'antigene. Les anticorps 
polyclonaux selon l 1 invention peuvent aussi etre prepares 

20 par purification sur une colonne d'af finite, sur laquelle a 
pr6alablement 6t€ immobilise un polypeptide selon 
1' invention, des anticorps contenus dans le sSrum de 
patients infect^s par une mycobact^rie et 
prSf Srentiellement une bact^rie appartenant au complexe 

25 Mycobacterium tuberculosis. 

L' invention a £galement pour objet des anticorps mono 
ou polyclonaux ou leurs fragments, ou anticorps 
30 chimeriques, caract€rises en ce qu'ils sont capables de 
reconnaStre specif iquement un polypeptide selon 
1 * invention. 

Les anticorps de 1' invention pourront 6galement §tre 
35 marques de la meme maniere que decrit pr6c£demment pour les 
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sondes nucleiques de 1' invention tel qu'un marquage de type 
enzymatique, fluorescent ou radioactif. 

L' invention vise en outre un proc£d6 pour la detection 
5 specif ique de la presence d'un antigSne d*une mycobact6rie 
et pr6f6rentiellement un bacterie du complexe Mycobacterium 

tuberculosis dans un 6chantillon biologique, caracterise en 

ce qu'il comprend les etapes suivantes : 

10 a) Mise en contact de 1 1 echant illon biologique (tissu ou 
fluids biologique) prelev£ chez un individu avec un 
anticorps mono ou polyclonal selon 1' invention , dans des 
conditions permettant une reaction immunologique in vitro 
entre lesdits anticorps et les polypeptides spScifiques des 

15 mycobacteries et pr6f Srentiellement des bacteries du 
complexe de Mycobacterium tuberculosis eventuellement 

presents dans 1 *6chantillon biologique, et 

b) Mise en Evidence du complexe antigene-anticorps forme* 

20 Entre egalement dans le cadre de l 1 invention, un 

n^cessaire ou kit pour le diagnostic in vitro sur un 

echantillon biologique, de la presence de souches de 
mycobacteries des mycobacteries et pref erentiellement des 
bacteries appartenant au complexe de Mycobacterium 

25 tuberculosis, de preference M. tuberculosis, caracterise en 

ce qu'il comprend : 

- un anticorps polyclonal ou monoclonal selon I 1 invention, 
le cas echeant marque ; 

- le cas echeant, un reactif pour la constitution du milieu 
30 propice S la realisation de la reaction immunologique; 

un reactif permettant la detection des complexes 
antigene-anticorps produits par la reaction immunologique , 
ce reactif pouvant £galement porter un marqueur, ou etre 
susceptible d'etre reconnu & son tour par un reactif 
35 marque, plus particulierement dans le cas oil ledit 
anticorps monoclonal ou polyclonal n'est pas marque. 
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- le cas EchEant, des rEactifs pour effectuer la lyse des 
cellules de 1 1 echantillon teste. 

La prEsente invention a Egalement pour objet un 
5 procEdE de detection et d' identification rapide des 
mycobactEries et prEfErentiellement des bactEries de M. 
tuberculosis dans un Echantillon biologique, caractErisE 

en ce qu'il comporte les Etapes suivantes : 

a) Isolement de l'ADN £ partir de 1 1 Echantillon 
10 biologique & analyser, ou obtention d'un ADNc a partir de 

1 * ARN de 1 Echantillon biologique ; 

b) Amplification spEcifique de l'ADN des mycobactEries et 
prEfErentiellement des bactEries appartenant au complexe 
Mycobacterium tuberculosis & l*aide d* amorces selon 

15 1' invention; 

c) Analyse des produits d 1 amplification. 

Le produits d ' amplification peuvent etre analyses par 
differentes mEthodes. 
20 Deux mEthodes d* analyse sont donnees a titre d'exemple 

ci-dessous : 

Analyse ElectrophorEtique en gel d" agarose des 
produits d 1 amplification. La prEsence d"un fragment d'ADN 
migrant S l'endroit attendu suggere que 1* Echantillon 
25 analyse contenait de 1 1 ADN de mycobactEries appartenant au 
complexe tuberculosis, ou 

- Analyse par la technique d 1 hybridation molEculaire 
en utilisant une sonde nuclEique selon 1' invention. Cette 
sonde sera avantageusement marquee par un element non 
30 radioactif (sonde froide) ou radioactif. 

Aux fins de la prEsente invention, on entendra par 
« ADN de 1* echantillon biologique » ou « ADN contenu dans 
1» echantillon biologique », soit l'ADN present dans 
35 1 echantillon biologique considEre, soit 1 1 ADNc obtenu 
aprds 1' act ion d'une enzyme de type transcriptase inverse 
sur l'ARN prEsent dans ledit Echantillon biologique. 
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Un autre proc6d6 de la presente invention permet la 
detection d'une infection par une mycobactfirie et 
5 pr§££rentiellement une bacterie du complexe Mycobacterium 

tuberculosis dans un mammifere. Ce proc6d6 comprend les 

Stapes suivantes : 

a) preparation d'un echantillon biologique contenant des 
cellules dudit mammifere plus particulierement des cellules 

10 du syst&me immunitaire dudit mammifere et plus 
particuliSrement encore des cellules T ; 

b) incubation de 1 ' echantillon biologique de I'etape a) avec 
un polypeptide selon I 1 invention; 

c) detection d'une reaction cellulaire indiquant une 
15 sensibilisation prealable du mammifere audit polypeptide 

notamment la proliferation cellulaire et/ou la synthase de 
proteines telles que 1 1 interferon gamma; 

d) detection d'une reaction d'hypersensibilite retardee ou 
de sensibilization du mammifere audit polypeptide. 

20 

Cette methode de detection est une methode 
intradermique, qui est d6crite par exemple par M, J, Elhay 
et al. (1988) Infection and Immunity, 66(7) : 3454-3456. 

25 Un autre but de la presente invention consiste en un 

proc£d£ pour la detection des mycobacterias et 
pref erentiellement des bact6ries appartenant au complexe 
MycoJbacteriu/n tuberculosis dans un echantillon biologique, 
caracterise en ce qu ! il comprend les etapes suivantes : 
30 a) Mise en contact d*une sonde oligonucieotidique selon 
1 1 invention avec un echantillon biologique , 1 * ADN contenu 
dans 1' echantillon biologique, ou 1'ADNc obtenu par 
transcription inverse de l'ARN de 1 'echantillon biologique, 
ayant, le cas echeant, prealablement ete rendu accessible a 
35 1' hybridation, dans des conditions permettant 1' hybridation 
de la sonde a 1 1 ADN ou l'ADNc des mycobacteries et 
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pr6£erentiellement des bacteries du complexe Mycobacterium 
tuberculosis; 

b) Detection de I'hybride £orm£ entre la sonde 
oligonucl6otidique et l'ADN de 1 • 6chantillon biologique. 

5 

L* invention vise figalement un proc6d6 pour la detection 
des mycobact6ries et pr6f6rentiellement des bacteries 
appartenant au complexe Mycobacterium tuberculosis dans un 

Schantillon biologique, caract£ris£ en ce qu'il comprend 
10 les etapes suivantes : 

a) Mise en contact d'une sonde oligonucl£otidique selon 
l 1 invention immobilis£e sur un support, avec un 
6chantillon biologique, 1 'ADN de 1 * gchantillon biologique 
ayant, le cas £ch£ant, 6te pr6alablement rendu accessible a 

15 1 1 hybridation, dans des conditions permettant 1 4 hybridation 
de ladite sonde a l'ADN des mycobact6ries et 
prSferentiellement des bacteries du complexe Mycobacterium 

tuberculosis; 

b) Mise en contact de l'hybride forme entre ladite sonde 
20 oligonucleotidique immobilisfee sur un support et 1 * ADN 

contenu dans 1 ' 6chantillon biologique, le cas 6cheant apres 
elimination de l'ADN de 1 'Schantillon biologique n'ayant 
pas hybride avec la sonde, avec une sonde 
oligonucleotidique marquee selon 1' invention. 

25 

Selon un mode de realisation avantageux du proced£ de 
detection dfefini pr6c6demment , celui-ci est caract£ris§ en 
ce que, pr^alablement a l'£tape a), 1 'ADN de 1 1 echantillon 
biologique est pr6alablement amplifie a I'aide d'un couple 
30 d' amorces selon I 1 invention. 

Une autre forme de mise en oeuvre du proc6d6 de 
detection selon 1' invention consiste en un proced6 pour la 
detection de la presence des mycobacteries et 
35 prSferentiellement des bacteries appartenant au complexe de 
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Mycobacterium tuberculosis dans un 6chantillon biologique, 
caract£rise en ce qu'il comprend les etapes suivantes : 

a) Mise en contact de 1 ' echantillon biologique avec un 
5 couple d'amorces selon 1 ' invention., 1 1 ADN contenu dans 

1 'Echantillon ayant 6t&, le cas <§ch£ant, prSalablement 
rendu accessible a 1 ' hybridation, dans des conditions 
permettant une hybridation desdites amorces & 1 'ADN des 
mycobacterias et pr6f6rentiellement des bactEries du 
10 complexe Mycobacterium tuberculosis; 

b) Amplification de 1 1 ADN d'une mycobacterie et 
preferentiellement d'une bacterie du complexe Mycobacterium 
tuberculosis; 

15 

c) mise en Evidence de 1 1 amplification de fragments d'ADN 
correspondant au fragment encadre par les amorces, par 
exemple par 61ectrophor£se sur gel ou au moyen d'une sonde 
oligonuclEotidique selon invention. 

20 

L' invention a aussi pour objet un procede pour la 
detection de la presence des mycobacterias et 
preferentiellement des bact£ries appartenant au complexe de 
Mycobacterium tuberculosis dans un echantillon biologique 

25 par deplacement de brin # caracterisE en ce qu'il comprend 
les Stapes suivantes : 

a) Mise en contact de 1 ■ Echantillon biologique avec deux 
couples d'amorces selon 1' invention specif iquement 
destinies Sl 1 ' amplification de type SDA decrites ci-dessus, 
30 I'ADN contenu dans 1 'echantillon ayant ete, le cas £cheant, 
pr6alablement rendu accessible k 1 ' hybridation, dans des 
conditions permettant une hybridation des amorces a I'ADN 
des mycobactEries et pr§f erentiellement des bacteries du 
complexe Mycobacterium tuberculosis; 



WO 99/09186 



PCI7FR98/01813 



56 

b) amplification de 1 1 ADN des mycobacteries et 
pr£ferentiellement des bact£ries du complete Mycobacterium 
tuberculosis: 

c) mise en Evidence de 1 ' amplification de fragments d 1 ADN 
5 correspondant au fragment encadr£ par leg amorces, par 

exemple par eiectrophorese sur gel ou au moyen d'une sonde 
oligonucl£otidique selon 1' invention. 

L l invention concerne aussi un necessaire ou kit pour 
10 la mise en oeuvre du procede d£crit ci-dessus, destine S la 
detection de la presence des mycobacteries et 
pref erentiellement des bacteries du complexe Mycobacterium 

tuberculosis dans un 6chantillon biologique, caracterise en 

ce qu'il comprend les elements suivants ; 
15 a) Une sonde oligonucieotidique selon 1* invention ; 

b) Les reactifs necessaires a la mise en oeuvre d'une 
reaction d* hybridation; 

c) Le cas ech£ant, un couple d 1 amorces selon I 1 invention 
ainsi que les reactifs necessaires a une reaction 

20 d' amplification de l'ADN (ADN genomique, ADN plasmidique ou 
ADNc) des mycobacteries et pr£f erentiellement des bactSries 
du complexe Mycobacterium tuberculosis . 

L'invention a aussi pour objet un kit ou necessaire 
25 pour la detection de la presence des mycobacteries et 
pr£f erentiellement des bacteries du complexe Mycobacterium 

tuberculosis dans un fechantillon biologique, caracterise en 

ce qu'il comprend les elements suivants : 

a) Une sonde oligonucieotidique, dite sonde de capture, 
30 selon 1' invention; 

b) Une sonde oligonucleotidique, dite sonde de 
revelation, selon l 1 invention. 

c) Le cas echeant, un couple d 1 amorces selon 1' invention 
ainsi que les reactifs necessaires a une reaction 

35 d' amplification de l'ADN des mycobacteries et 
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pref£rentiellement des bact6ries du complexe Mycobacterium 
tuberculosis. 

L 1 invention concerne encore un kit ou n6cessaire pour 
5 1 1 amplification de l'ADN des mycobact6ries et 
pr6f erentiellement des bacteries du complexe Mycobacterium 
tuberculosis present dans un 6chantillon biologique, 
caractferisS en ce qu'il comprend les SISments suivants : 

10 a) Un couple d'amorces selon ^invention; 

b) Les r£actifs necessaires pour effectuer une reaction 
d'amplif ieation d'ADN; 

c) Eventuellement un composant permettant de verifier la 
sequence du fragment amplifie, plus particulierement une 

15 sonde oligonucleotidique selon I 1 invention. 

Un autre objet de la prSsente invention concerne une 
composition immunogene, caract6risee en ce qu'elle comprend 
un polypeptide selon I 1 invention. 

20 

Une autre composition immunogene selon 1' invention est 
caracteris6 en ce qu'elle comprend un ou plusieurs 
polypeptides selon l 1 invention et/ou un ou plusieurs 
polypeptides hybrides selon 1' invention. 

25 

Selon un mode de realisation avantageux, la 
composition immunogene ci-dessus definie est constitutive 
d'un vaccin, lorsqu'elle est presentee en association avec 
un v£hicule pharmaceutiquement acceptable et Eventuellement 
30 un ou plusieurs adjuvants de 1' immunity tels que l'alun ou 
un repr6sentant de la famille des muramyl peptides ou 
encore I 1 adjuvant incomplet de Freund. 

Aujourd'hui, divers types de vaccina sont disponibles 
35 pour protfeger l'homme contre des maladies infect ieuses : 
micro-organismes vivants attenuEs (M. bovis - BCG pour la 
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10 



tuberculose) , micro-organismes inactive (virus de la 
grippe), des extraits acellulaires (Bordetella pertussis 
pour la coqueluche), prolines recombinees (antigene de 
surface du virus de 1' hepatite B) , des polyosides 
(pneumocoques) . Des vaccins prepares a partir de peptides 
de synthase ou de micro-organismes genetiquement modifies 
exprimant des antigenes hfiterologues sont en cours 
d- experimentation. Plus recemment encore, des ADN 
plasmidiques recombines portant des genes codant pour des 
antigenes protecteurs ont ete proposes comme strategie 
vaccinale alternative. Ce type de vaccination est realise 
avec un plasmide particulier derivant d'un plasmide de E. 
coli qui ne se replique pas in vivo et qui code 
uniquement pour la proteine vaccinante. Les principaux 
15 composants fonctionnels de ce plasmide sont : un promoteur 
fort permettant 1 'expression dans les cellules eucaryotes 
(par exemple celui du CMV) , un site de clonage approprie 
pour inserer le gene d'interet, une sequence de 
terminaison-polyadenylation, une origine de replication 
procaryote pour produire le plasmide recombine in vitro 
et un marqueur de selection (par exemple le gene de 
resistance a 1 'ampicilline) pour faciliter la selection 
des bacteries qui contiennent le plasmide. Des animaux ont 
ete immunises en injectant simplement 1 'ADN plasmidique nu 
dans le muscle. Cette technique conduit a 1' expression de 
la proteine vaccinale in situ et a une r 6ponse 
immunitaire en particulier de type cellulaire (CTL) et de 
type humoral (anticorps) . Cette double induction de la 
reponse immunitaire est l'un des principaux avantages de 
la technique de vaccination avec de 1 1 ADN nu. Huygen et 
al. (1996) et Tascon et al. (1996) ont reussi a obtenir 
une certaine protection contre M. tuberculosis en 
injectant des plasmides recombines contenant des genes de 
M. leprae (hap65, 36kDa pra ) comme inserts. M. leprae 
est 1- agent responsable de la lepre. L ' utilisation d'un 
insert spScifique de m. tuberculosis comme par exemple 
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tout ou partie du gfene DP428, objet de la prisente 
invention conduirait probablement 51 une meilleure 
protection centre la tuberculose. Tout ou partie du gene 
DP428, ou tout polynucleotide selon 1* invention, peut etre 
5 facilement ins6r6 dans les plasmides vecteurs V1J 
(Montgomery et al, 1993) # pcDNA3 (Invitrogen, R&D 
Systems) ou pcDNAl/Neo (Invitrogen) qui possedent les 
caract6ristiques n6cessaires pour une utilisation 
vaccinale. 

10 

L 1 invention vise ainsi un vaccin, caracterisee en ce 
qu'il comprend un ou plusieurs polypeptides selon 
1' invention et/ou un ou plusieurs polypeptides hybrides 
selon 1* invention tels que preeedemment definis en 
15 association avec un vfihicule pharmaceut iquement compatible 
et, le cas 6cheant, un, ou plusieurs adjuvants de 
l'immunite appropries . 

L 1 invention vise aussi une composition vaccinale 
20 destin£e a 1 * immunisation de 1 • homme ou 1' animal a 
l'encontre d ! une infection bacterienne ou virale, telle que 
la tuberculose ou 1' hepatite, caracterisee en ce qu'elle 
comprend un ou plusieurs polypeptides hybrides tels que 
prec6demment d6finis en association avec un vShicule 
25 pharmaceut iquement compatible et, le cas 6ch€ant, un ou 
plusieurs adjuvants de I'immunite. 

Avantageusement , dans le cas d'une proteine hybride 
entre un polypeptide selon 1' invention et I'antigene de 
30 surface de I'hepatite B, la composition vaccinale sera 
administree, chez l'homme, £ raison de 0,1 a 1 //g de 
protSine hybride purifiee par kilogramme du poids du 
patient, de pr§f£rence 0,2 & 0,5 ng/kg de poids du patient, 
pour une dose destinee a une administration donnee. Dans le 
35 cas de patients atteints de troubles du systfeme 
immunitaire, en particulier les patients immunodeprimes, 
chaque dose injectee contiendra pr£f erentiellement la 
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moitie de la quantity ponderale de la proteine hybride 
contenue dans une dose destinee & un patient n'6tant pas 
affected de troubles du systeme immunitaire* 

5 De preference, la composition vaccinale sera 

administr6e & plusieurs reprises, de mani&re 6talee dans le 
temps, par voie intradermique ou sous-cutan6e . A titre 
d'exemple, trois doses telles que dfifinies ci-dessus seront 
respectivement administrees au patient au temps to, au 

10 temps to + 1 mois et au temps to + I an. 

Alternativement , trois doses seront respectivement 
administrees au patient au temps to, au temps to + l mois 
et au temps to + 6 mois. 

15 Chez la sour is, chez laquelle une dose pond§rale de la 

composition vaccinale comparable 3 la dose utilis£e chez 
l'homme est administree, la reaction anticorps est testee 
par prelevement du serum suivi d'une etude de la formation 
d'un complexe entre les anticorps presents dans le s6rum et 

20 l*antigene de la composition vaccinale, selon les 
techniques usuelles. 

L 1 invention concerne 6galement une composition 
immunog&ne caracteris6e en ce qu f elle comprend un 
25 polynucleotide ou un vecteur d' expression selon 
I'invention, en association avec un v§hicule permettant son 
administration li l'homme ou l 1 animal. 

L* invention a encore pour objet un vaccin destine S 
30 1 1 immunisation a I'encontre d'une infection bact£rienne ou 
virale, telle que la tuberculose ou l 1 hepatite, caracterise 
en ce qu'il comprend un polynucleotide ou un vecteur 
d 1 expression selon 1' invention, en association avec un 
v^hicule pharmaceutiquement acceptable* 

35 

De telles compositions immunog&nes ou vaccinales sont 
notamment . decrites dans la demande internationale N° WO 
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90/11092 (Vical Inc.) et egalement dans la demands 
intemationale N° WO 95/11307 (Institut Pasteur) . 

Le polynucleotide constitutif de la composition 
5 immunog&ne ou de la composition vaccinale selon 1" invention 
peut §tre injecte k I'hote aprds avoir 6te couple a des 
composes qui favorisent la penetration de ce polynucleotide 
& l'interieur de la cellule ou son transport jusqu'au noyau 
cellulaire. Les conjugues resultants peuvent etre 
|() encapsuies dans des microparticules polym^res, comme decrit 
dans la demande Internationale N° WO 94/27238 (medisorb 
Technologies International) . 

Selon un autre mode de realisation de la composition 
15 immunogdne et/ou vaccinale selon l 1 invention, le 
polynucleotide, de preference un ADN, est complexe avec du 
DEAE-dextran (Pagano et al., 1967) ou avec des proteines 
nucleaires {Kaneda et al . , 1989), avec des lipides (Feigner 
et al., 1987) ou encore encapsuies dans des liposomes 
20 (Fraley et al . , 1980) . 

Selon encore un autre mode de realisation avantageux 
de la composition immunogene et/ou vaccinale selon 
l 1 invention, le polynucleotide selon 1' invention peut etre 

25 introduit sous la forme d'un gel facilitant sa transfection 
daas les cellules. Une telle composition sous forme de gel 
peut etre un complexe de poly-L-lysine et de lactose, comme 
decrit par Midoux en 1993, ou encore le Poloxamer 407™, 
comme decrit par Pastore en 1994. Le polynucleotide ou le 

30 vecteur selon 1 1 invention peuvent aussi etre en suspension 
dans une solution tampon ou £tre associes a des liposomes. 

kvantageusement , un tel vaccin sera prepare 
conformement a la technique decrite par Tacson et al. ou 
35 Huygen et al. en 1996 ou encore conformement a la technique 
decrite par Davis et al. dans la demande Internationale N° 
WO 95/11307 (Whalen et al.). 
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Un tel vaccin sera avantageusement prepare sous la 
forme d'une composition contenant un vecteur selon 
I 1 invention, plac£e sous le controle d'Slfements de 
regulation permettant son expression chez I'homme ou 
5 X 1 animal. 

Pour r6aliser un tel vaccin, le polynucleotide selon 
X 1 invention est tout d'abord sous-clone dans un vecteur 
d' expression approprie, plus part iculi&rement un vecteur 
10 d 1 expression contenant des signaux de regulation et 
d 1 expression reconnus par les enzymes des cellules 
eucaryotes et contenant egalement une origine de 
replication active chez les procaryotes, par exemple chez 
E. coli, qui permet son amplification prealable* Puis le 

IS plasmide recombinant purifiS obtenu est injecte 3 l'hote, 

par exemple par voie intramusculaire . 

On pourra par exemple utiliser, en tant que vecteur 

d' expression in vivo de l'antigene d'int£ret, le plasmide 

pcDNA3 ou le plasmide pcDNAl/neo, tous les deux 
20 commercialises par Invitrogen (R&D Systems, Abingdon, 

Royaume-Uni) . On peut aussi utiliser le plasmide VlJns.tPA, 

d£crit par Shiver et al. en 1995. 

Un tel vaccin comprendra avantageusement, outre le 

vecteur recombinant, une solution saline, par exemple une 
25 solution de chlorure de sodium, 

Une composition vaccinale telle que d6finie ci-dessus sera 
par exemple administr6e par voie parent^rale ou par voie 
intramusculaire . 

30 

La presente invention concerne egalement un vaccin 
caractSrise en ce qu'il contient une ou plusieurs sequences 
nuclfeotidiques selon 1' invention et/ou un ou plusieurs 
polynucleotides tel que mentionn£ ci-dessus en association 
35 avec un v£hicule pharmaceutiquement compatible et, le cas 
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fecheant, un ou plusieurs adjuvants de 1' immunity 
appropri6s . 

Un autre aspect porte sur une mfethode de criblage de 
5 molecules capables d^nhiber la croissance de mycobact6ries 
ou le maintien de mycobactferies dans un h6te, caract6ris6e 
en ce que lesdites molecules bloquent la synthase ou la 
fonction des polypeptides codes par une sequence 
nucl6otidique selon 1' invention ou par un polynucleotide 
10 tel que decrit supra* 

Dans ladite methode de criblage, les molecules peuvent 
£tre des anti-messagers ou peuvent induire la synthase 
d'anti-messagers . 

15 

La prfesente invention vise ggalement des molecules 
capables d'inhiber la croissance de mycobact6ries ou le 
maintien de mycobact£ries dans un bote, caract€ris£es en ce 
que lesdites molecules sont synth6tis6es d'apres la 
20 structure des polypeptides codes par une sequence 
nuclSotidique selon 1' invention ou par un polynucleotide 
tel que d£crit supra. 

D'autres caractgristiques et avantages de l 1 invention 
25 apparaissent dans les exemples et les figures suivants : 



FIGURES 

30 La serie de Figures 1 : 

La serie de Figures 1 illustre la serie de sequences 
nuclfiotidiques SEQ ID N°l correspondant a 1 1 insert du 
vecteur pDP428 (depose a la CNCM sous le N° 1-1818) et 
35 la serie de sequences d'acides amines SEQ ID N°l des 
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polypeptides cod6s par la s6rie des sequences 
nucl6otidiques SEQ ID N°l. 

Figure 2 : 

5 

Illustre la sequence nucl6otidique SEQ ID N°2 
correspondant a la region incluant le gene codant pour 
le polypeptide DP428 (region soulignfie) . Sur cette 
figure ont 6t6 pris en compte a la fois les codons ATG 

10 et GTG d' initiation de la traduction. La figure fait 
apparaitre que le polypeptide DP428 fait probablement 
partie d'un opSron comprenant au moins trois genes. La 
region doublement encadr£e inclut probablement les 
regions promotrices, 

15 La rfigion simplement encadrSe correspond au motif LPISG 
rapellant le motif LPXTG d6crit chez les bactSries a 
Gram positifs comme permettant l'ancrage aux 
peptidoglycannes . 

20 La serj.e de Figures 3 : 

La serie de Figures 3 repr^sente la serie de sequences 
nucl6otidiques SEQ ID N°3 correspondant a 1 1 insert du 
vecteur p6D7 (depos€ & la CNCM sous le N° 1-1814) . 

25 

La serie de Figures 4 : 

La serie de Figures 4 reprfesente la s6rie de s6quences 
nucl6otidiques SEQ ID N°4 correspondant & 1 1 insert du 
30 vecteur p5A3 (deposS £ la CNCM sous le N° 1-1815. 

La s6rie de Figures 5 : 

La s§rie de Figures 5 repr6sente la s€rie de sequences 
35 nucleotidiques SEQ ID N*5 correspondant a 1" insert du 
vecteur p5F6 (d£pos£ S la CNCM sous le N° 1-1816) . 
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La serie de Figures 6 : 

La serie de Figures 6 represente la serie de sequences 
nucleotidiques SEQ ID N°6 correspondant a 1 ' insert du 
5 vecteur p2A29 (depose a la CNCM sous le N° 1-1817) 

La serie d* Figures 7 • 

La serie de Figures 7 represente la serie de sequences 
10 nucleotidiques SEQ ID N°7 correspondant a 1 ■ insert du 
vecteur P 5B5 (depose a la GNCM sous le N° 1-1819) . 

La s6rie de Figures a : 

La s6rie de Figures 8 represente serie de sequences 
15 nucleotidiques SEQ ID N° 8 correspondant a 1 ' insert du 
vecteur plC7 (depose & la CNCM sous le N» 1-1820). 

La serie de Figures 9 : 

20 La serie de Figures 9 represente la serie de sSquences 
nucleotidiques SEQ ID N°9 correspondant a 1 • insert du 
vecteur p2D7 (depose a la CNCM sous le N° 1-1821) . 

La s6rie d e Fig ures in ■ 

25 

La serie de Figures 10 represente la serie de sequences 
nucleotidiques SEQ ID N<>10 correspondant a 1 ' insert du 
vecteur P 1B7 (depose a la CNCM sous le N<> 1-1843) . 

30 La ser^ de Pig nr ^g 11 . 

La serie de Figures 11 represente la serie de sequences 
nucleotidiques SEQ ID N°li. 



35 



La s&ri e de Figures 12 
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La serie de Figures 12 repr£sente la s6rie de sequences 
nucl6otidiques SEQ ID N°12> 

La s£rie de Figures 13 : 

5 

La s6rie de Figures 13 reprSsente la s6rie de sequences 
nucl£otidiques SEQ ID N°13. 

La s6rie de Figures 14 : 

10 

La serie de Figures 14 repr6sente la s6rie de sequences 
nucleotidiques SEQ ID N°14 correspondant 3 1 • insert du 
vecteur p5B5 (depose a la CNCM sous le N° 1-1819). 

15 

La sferie de Figures IS : 

La s£rie de Figures 15 represente la serie de sequences 
20 nucl£otidiques SEQ ID N°15. 

La sSrie de Fi gures 16 : 

La serie de Figures 16 represente la sSrie de sequences 
25 nucl6otidiques SEQ ID N°16. 

La s^y^e.de Figures 3,7 : 

La s§rie de Figures 17 represente la serie de sequences 
30 nucl6otidiques SEQ ID N°17, 

La s6rie de Figures 18 : 

La serie de Figures 18 represente la s§rie de sequences 
35 nucleotidiques SEQ ID N°18. 

Lfr serie de Figures 19 : 
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La sgrie de Figures 19 represente la s6rie de sequences 
nucleotidiques SEQ ID N°19. 

5 La s6rie de Figures 20 : 



La s6rie de Figures 20 represente la s€rie de sequences 
nucleotidiques SEQ ID N°20 correspondant a l 1 insert du 
vecteur p2A29 (d6pos6 a la CNCM sous le N° 1-1817) . 

»° 

La serie de Figures 21 ; 

La serie de Figures 21 represente la s£rie de sequences 
nucleotidiques SEQ ID N°21. 

15 

La serie de Figures 22 : 

La serie de Figures 22 represente la serie de sequences 
nucleotidiques SEQ ID N°22. 

20 

La serie de Figures 23 : 



La serie de Figures 23 represente la serie de sequences 
nucleotidiques SEQ ID N°23. 

25 

La serie de Figures 24 : 

La serie de Figures 24 represente la serie de sequences 
nucleotidiques SEQ ID N°24, 

30 

Figures 25 et 26 : 

Les figures 25 et 26 illustrent respectivement les 
sequences SEQ ID N°25 et SEQ ID N°26 represent ant un 
couple d' amorces utilis6es pour amplifier 
35 specif iquement par PGR la region correspondant aux 
nucleotides 964 a 1234 inclus dans la sequence SEQ ID 
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La s6rie de Figures 27 : 

La s£rie de Figures 27 represente la s6rie de sequences 
5 nucl6otidiques SBQ ID N°27 correspondant 3 1 ' insert du 
vecteur p5A3 . 

Figure 28 : 

10 La sequence d'acides amines telle que definie dans la 
figure 28 reprSsente la sequence d'acides amines SEQ ID 
N°28 correspondant au polypeptide DP428. 

15 Figure 29 : 

La figure 2 9 represente la sequence nucleot idique SEQ ID M° 
29 du g£ne complet codant pour la prot£ine M1C25. 

20 F ig ur e 3 0 : 

La figure 30 represente la sequence d'acides amines SEQ ID 
N° 30 de la proteine M1C25. 

25 La aerie de Figures 31 : 

La sSrie de Figures 31 represente la s£rie de sequences 
nucleot idiques SEQ ID N°31. 

30 La s£rie de Figures 32 : 

La s6rie de Figures 32 represente la s£rie de sequences 
nucl6otidiques SEQ ID N°32. 



35 La serie de Figures 33 
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La s6rie de Figure 8 33 represente la s£rie de sequences 
nucleotidiques SEQ ID N°33. 

La serie dp Figures 34 - 

5 

La serie de Figures 32 represente la serie de sequences 
nucleotidiques SEQ ID N°34. 

La serie de Figures 3^ - 

10 

La serie de Figures 35 represente la serie de sequences 
nucleotidiques SEQ ID N°35, 



15 

La seri e de Figures 36 : 

La serie de Figures 36 represente la serie de sequences 
nucleotidiques SEQ ID N°36. 



20 



25 



La seri e de Figures 37 : 

La serie de Figures 37 represente la serie de sequences 
nucleotidiques SEQ ID N°37. 

La serie de Figure* w ■ 



La s6rie de Figures 38 represente la serie de sequences 
nucleotidiques SEQ ID N°38. 

30 

fca__s_erie de Figures 3 9 : 

La serie de Figures 3 9 represente la serie de sequences 
nucleotidiques SEQ ID N°39. 

35 

La s erje de Figures 40 : 
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La s6rie de Figures 40 represente la s£rie de sequences 
nucl£otidiques SEQ ID N°40, 

La s6rie de Figures 41 : 

5 

La s£rie de Figures 41 represente la s6rie de sequences 
nucieotidiques SEQ ID N°41 correspondant a 1 • insert du 
vecteur p2D7 (d6pos6 £ la CNCM sous le N°I-1821) . 

U> La a£rie de piques 4£ _: 

La serie de Figures 42 represents la serie de sequences 
nucieotidiques SEQ ID N°42. 

15 

La serie de Figures 43 : 

La serie de Figures 43 represente la serie de sequences 
20 nucleotidiques SEQ ID N°43. 

La s£rie de figures 44 -. 

La serie de Figures 44 represente la serie de sequences 
25 nucieotidiques SEQ ID N°44 ♦ 

La sferie de Figures 45 : 

La serie de Figures 45 represente la serie de sequences 
30 nucieotidiques SEQ ID N°45. 

La serie de Figures 46 : 

La serie de Figures 46 represente la s6rie de sequences 
35 nucieotidiques SEQ ID N°46. 

La s6rie de Figures 47 : 
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La serie de Figures 47 repr6sente la serie de sequences 
nucl£otidiques SEQ ID N°47. 

5 La , 36rie d e piques 4 8 : 

La s6rie de Figures 4 8 reprSsente la s£rie de sequences 
nucl^otidiques SEQ ID N°48. 

W La serie de Figures 49 ; 

La s<£rie de Figures 4 9 represente la sSrie de sequences 
nucleotidiques SEQ ID N°49. 

15 

La s6rie de Figures 50 : 

La s6rie de Figures 50 represente la s£rie de sequences 
nucl6otidiques SEQ ID N°50. 

20 

Figure 51 : 

A. la construction pJVED: Plasmid navette ( pouvant se 
multiplier chez les mycobactfiries ainsi que chez 

25 E.coli) , avec un gene de resistance a la kanamycine 
(issu de Tn903) comme marqueur de selection. Le g&ne 
phoA tronque(A phoA) et le g&ne 2uc forment un opferon 
synthetique ♦ 

B. Sequence de la jonction entre phoA et luc. 

30 

Figure 51 : 

Hybridation genomique (Southern blot) de l'ADN 
genomique de differentes especes mycobact£riennes S 
35 l'-aide d'une sonde oligonucl6otidique dont la sequence 
est la sequence comprise entre le nucleotide en 
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position nt 964 (extr<5mite 5' de la sonde) et le 
nucleotide en position nt 1234 (extremity 3» de la 
sonde), extr6mit£s indues, de la sequence SEQ ID N°l. 

5 Figures 53 et 54 : 

Activitfes Luc et PhoA de M. smegma t is recombinant 

contenant le pJVED avec different s fragments 
nucl§otidiques comme dfecrits en exemple. Les figures 52 
10 et 53 repr6sentent les resultats obtenus pour deux 
experiences distinctes realisees dans les memes 
conditions . 

15 

Figure 55 : 

Representation de 1 1 hydrophobic! te (Kyte et Doolitle) 
de la sequence codante du polypeptide DP4 28 avec sa 
20 representation schematique, Le motif LPISG precede 
immSdiatement la region C-terminale hydrophobe. La 
sequence se termine par deux arginines. 

Figure 56 : 

25 Representation de 1 1 hydrophoicite (Kyte et Doolitle) de 
la sequence du polypeptide M1C25 de sequence decides 
amines SEQ ID N° 30. 

Figure 57 : 

30 

A- Gel d'acrylamide (12%) en condition denaturante d'un 
extrait bacterien obtenu par sonication de bactSries JS. 

coli M15 contenant le plasmide pMlC25 sans et aprfes 4 
heures d* induction par l^PTG, colore au bleu de 
35 Comassie ♦ 
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ligne i : Marqueur de masse molaire (Prestained SDS-PAGE 
Standards High Range RIO-RAD<ffl). 

ligne 2; Extrait bacterien obtenu par sonication de 
5 bact£ries E. coli M15 contenant le plasmide pMlC25 

sans induction par l'IPTG. 

ligne 3: Extrait bacterien obtenu par sonication de 
bacteries E* coli M15 contenant le plasmide pMlC25 

10 apres 4 heures d* induction par l'IPTG, 

ligne 4: Marqueur de masse molaire (Prestained SDS-PAGE 
Standards Low Range BIORAD®) . 

15 

B- Western blot d'un gel semblable gel (acrylamide 12%) 
revile grace a l f anticorps penta-His commercialise par la 
society Quiagen. 

20 ligne 1: representation du marqueur de masse molaire 
(Prestained SDS-PAGE Standards High Range IU0jJ<Al)@j/ 

ligne 2:extrait bacterien obtenu par sonication de 
bact6ries E* coli M15 contenant le plasmide pMlG25 

25 sans induction par l'IPTG. 

ligne 3 -.extrait bacterien obtenu par sonication de 
bacteries E. coli M15 contenant le plasmide pMlC25 

apres 4 heures d' induction par l'IPTG. 

30 

ligne 4: representation du marqueur de masse molaire 
(Prestained SDS-PAGE Standards Low Range BIO-RAD®) 



La bande pr£sente trds majoritairement dans les lignes 
35 correspondant aux bacteries induites par l'IPTG par rapport 
a celles-non induites par l'IPTG, comprise entre 34200 et 
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2B400 daltons, correspond £ 1* expression de 1 1 insert M1C25 
clone dans le vecteur pQE-60 (Qiagen®) . 



5 En ce qui concerne les 16gendes des autres figures qui 

sont num6rot6es par un caractdre alphanum<§rique, chacune de 
ces autres figures reprfisente la sequence nucl6otidique et 
la sequence decides amines de sequence SEQ ID dont la 
num6rotation est identique au caract&re alphanumferique de 

10 chacune desdites figures. 

Les num6rotations alphanumeriques des figures 
representant les SEQ ID comportant un nombre suivi d'une 
lettre ont les significations suivantes : 

- les num6rotations alphanumeriques pr£sentant le meme 
15 nombre concernent une m§me famille de sequence rattach^es £ 

la sequence de reference SEQ ID dont la numSrotation 
prSsente ce meme nombre et la lettre A ; 

- les lettres A, B et C pour une meme famille de sequences 
distinguent les trois phases de lecture possibles de la 

2t) sequence nucl£otidique SEQ ID de reference (A) ; 

- les lettres index6es par un prime (') signifient que la 
sequence correspond S un fragment de la sequence SEQ ID de 
reference (A) ; 

- la lettre D signifie que la sequence correspond a la 
25 sequence du gSne pr€dit par Cole et al . , 1998 ; 

- la lettre F signifie que la sequence correspond a la 
phase ouverte de lecture (ORF pour "Open Reading Frame") 
contenant la sequence H D M correspondante d'apr&s Cole et 
al., 1998 ; 

30 - la lettre G signifie que la sequence est une sequence 
prfidite par Cole et al., 1998, et prSsentant une homologie 
de plus de 70% avec la sequence SEQ ID de reference (A) ; 

- la lettre H signifie que la sequence correspond £ la 
phase ouverte de lecture contenant la sequence "G" 

35 correspondante d'aprSs Cole et al. r 1998 ; 

- la lettre R signifie que la sequence correspond a une 
sequence predite par Cole et al., 1998, en amont de la 
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sequence "D" correspondante et pouvant etre en phase avec 
la sequence "D M en raison d'erreurs de s^quen^age 
possibles ; 

- la lettre p signifie que la sequence correspond a la 
5 phase ouverte de lecture contenant la sequence M R " 

correspondante ; 

- la lettre Q signifie que la sequence correspond a une 
sequence contenant les sequences "F" et "P" 
correspondantes . 

K) En ce qui concerne la famille de sequences SEQ ID N° 

4/ 1* insert pr6c6dent phoA contient deux fragments non 

contigus sur le genome, SEQ ID 4 J et SEQ ID 4 A, et done 
issus d'un clonage multiple permettant l 1 expression et 
1 1 exportation de phoA. Ces deux fragments non contigus , les 

15 g£nes et les phases ouvertes de lecture qui les contiennent 
d'aprds Cole et al., 1998, sont important s pour 
1 ' exportation d'un polypeptide antigene : 

- les lettres J, K et L distinguent les trois phases de 
lecture possibles de la sequence nuci£otidique "J" 

20 correspondante ; 

- la lettre M signifie que la sequence correspond a la 
sequence predite par Cole et al., 1998, et contenant la 
sequence SEQ ID N° 4 J ; 

- la lettre N signifie que la sequence correspond a la 
25 phase ouverte de lecture contenant la sequence SEQ ID N° 

4M. 

En ce qui concerne la famille de sequences SEQ ID 
N° 45, la lettre Z signifie que la sequence correspond a la 
sequence d'un fragment clonfi fusionn£ avec phoA. 

30 Enfin, en ce qui concerne la famille de sequence SEQ 

ID N° 41, la lettre S signifie que la sequence correspond a 
une sequence predite par Cole et al , , 1998 et pouvant etre 
dans la m&me phase de lecture que la sequence W D M 
correspondante, la lettre T signifiant que la sequence 

35 correspondante contient les sequences M F" et "S M 
correspondantes , 
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10 



EXEMPLES 

Materiel et methodes 
Cultures bacteriennes, plasmides et milieux de cultures 

E. coli a ete cultive sur milieu liquide ou solide Luria- 
Bertani (LB) . M. emegmatis a ete cultive sur milieu liquide 
Middlebrook 7H9 (Difco) additionne de dextrose albumine 
(ADC) , 0,2 % de glycerol et 0,05 % de Tween, ou sur milieu 
solide L. Si necessaire, 1 • antibiotique kanamycine a ete 
rajoute a une concentration de 20 ^g/ml- 1. L es clones 
bacteriens presentant une activite PhoA ont ete detectes 
sur de l'agar LB contenant du 5-bromo^ -chloro-3-indolyle 
phosphate (X-P, a 40 /ig/ml- 1) . 

Manipulation d'ADN et sequencage 

Les manipulations d ' ADN et les analyses par 
20 Southern blot ont ete effectuees en utilisant les 
techniques standard (Sambrook et al . , 1989). Les sequences 
d'ADN double brun ont ete determines avec un kit de 
sequencage Tag Dye Deoxy Terminator Cycle (Applied 
Biosystems), dans un Systeme 9600 GeneAmp PCR (Perkin- 
Elmer), et apres migration sur un systeme d' analyse ADN 
modele 373 (Applied Biosystems) . 

Constructions des plasmides 



15 



25 



30 



35 



Le plasmide pJVED a a ete construit a partir de 
pLA71, plasmide de transfert comportant le gene phoA 
tronque et place en phase avec BlaF. pLA71 a ete coupe avec 
les enzymes de restriction Kpnl et WotI, retirant ainsi 
phoA sans toucher le promoteur de BlaF. Le gene luc codant 
pour la lucif erase de luciole a ete amplify a partir de 
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pGEM-luc et un site de liaison du ribosome a 6te rajoutS, 
phoA a §t§ amplifi6 a partir de pJEMll. Les fragments 
amplifies ont 6te coup6s avec Pstl et ligatures ensemble* 

Les oligod£oxynucl6otides utilises sont les suivants : 

5 pPV.luC.Fw : 5 1 GACTGCTGCAGAAGGAGAAGATCCAAATGG3 1 
luc.Bw : 5 1 GACTAGCGGCCGCGAATTCGTCGACCTCCGAGG3 1 
pJEM.phoA.Fw : 5 1 CCGCGGATCCGGATACGTAC3 1 
phoA * Bw : 5 • GAGTGCTGCAGTTTATTTCAGCCCC AG AGCG 3 • . 

Le fragment ainsi obtenu a 6te r6amplifi£ en 

10 utilisant les oligonucleotides compl6mentaires de ses 
extrSmites, coup£ avec Kpnl et NotI, et int6gr£ dans pLA71 
eoup£ avec les memes enzymes. La construction resultante a 
et£ electropor6e dans E* coli DH5a et M* smegmatis mc 2 155. 
Un clone AT, smegmatis 6mettant de la lumiSre et pr6sentant 

15 une activite phoA a et£ s£lectionne et appel6 pJVED/JblaF. 
L 1 insert a 6t6 retire en utilisant Ba/nHI et la construction 
referm£e sur elle-meme, reconstruisant ainsi le pJVEDa- 
Afin d'obtenir le pJVEDb,c» le multisite de clonage a 6te 
coupS avec Seal et Kpnl et referm£ en enlevant un (pJVEDb) 

20 ou deux (pJVED c ) nucleotides du site SnaBI. Apres fusion 
six cadres de lecture ont pu ainsi etre obtenus. L 1 insert 
du pJVED/hspltf a 6t6 obtenu par amplification en chalne par 

polymerase (ACP) de pPM1745 (Servant et al., 1995) en 
utilisant des oligonucleotides de la sequence : 
25 18-Fw : 5 1 GTACCAGTACTGATCACCCGTCTCCCGCAC3 ' 
18* Back : AGTCAGGTACCTCGCGGAAGGGGTCAGTGCG3 1 

Le produit a 6te coup£ avec Kpnl et Seal, et 
ligature & pJVED a , coup6 avec les memes enzymes, quittant 
ainsi le pJVED/hspia. 

30 

Le pJVED/ PI 9kDa et le pJVED/ erp furent const ruits en 
coupant avec BairiHl 1' insert de pExp4lO et pExp53 
respectivement , et en les inserant dans le site BairiHl du 
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multisite de clonage de pJVED a . 
Mesure de 1' activity phosphatase alkaline 

La presence d'activite est detectee par la couleur 
5 bleue des colonies croissant sur un milieu de culfcure 
contenant le substrat 5-bromo 4-chloro 3-indolyl phosphate 
<XP), puis I- activity pent etre mesuree quantitativement de 
maniere plus precise de la facon suivante : 

M. smegmatis ont ete cultives dans un milieu LB 
10 additions de 0,05 % de Tween 80 (Aldrich) et de 
kanamycine (20 ^g/ml- 1) a 310Q pendant ^ 
L'activite de la phosphatase alkaline a ete mesuree par la 
methode de Brockman et Heppel (Brockman et al. ( 1968) dans 
un extrait sonique, avec p-nitrophenylphosphate comme 
.5 substrat de la reaction. La quantite de prolines a ete 
mesuree par essai Bio-Rad. L'activite phosphatase alkaline 
est exprimee en unite arbitrage (densite optique a 420 nm 
x jig de prolines- 1 x minutes- 1) . 



20 



25 



30 



35 



Mesure de l'activite lucif erase 

M. smegmatis a ete cultive dans un milieu LB 
additionne de 0,05 % de Tween 80 (Aldrich) et de kanamycine 
(20 M g/ml- 1) a 37o C pendant 24 heures et utilise en pleine 
croissance exponentielle (DO a 600 nm comprise entre 0,3 et 
0,8). Les aliquots de suspensions bacteriennes ont ete 
bnevement soniques et 1 ■ extrait cellulaire a ete utilise 
pour mesurer l'activite de la lucif erase. 25 M l de 
1' extrait sonique ont ete melanges avec 100 M l de substrat 
(systeme d' essai lucif erase Promega) automatiquement dans 
un luminometre et la lumiere emise exprimee en ULR ou RLU 
(Unites Lumineuses Relatives). Les bacteries ont ete 
comptees par dilutions serielles de la suspension d'origine 
sur milieu agar LB kanamycine et l'activite de la 
luciferase exprimee en ULR/^g de prolines bacteriennes ou 
en ULR/103 bacteries. 
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Construction de banques g6nomiques de M. tuberculosis et 
de M. bovis~BCG 

5 Les banques ont 6t6 obtenues en utilisant 

essentiellement pJVED 3/ b,c pr6c6demment decrits. 

Preparation de macrophages issus de la moelle osseuse et 
infection par Af. smegma tis recombinants 

K) 

Les macrophages issus de la moelle osseuse ont 6te 
pr§par§s comme decrits par Lang et al,, 1991. En resume, 
les cellules de la moelle osseuse ont §te preleves du fimur 
de souris C57BL/6 ag6e de 6 ^ 12 semaines (If fa-Credo, 
15 France) . Les cellules en suspensions ont 6t£ lav6es et 
resuspendues dans du DMEM enrichi avec 10 % de s§rum foetal 
de veau, 10 % de milieu L-cell conditionn6 et 2 mM de 
glutamine, sans antibiotiques . 106 cellules ont 6t£ 
ensemencees sur des plaques 24 puits Costar & fond plat 
20 dans 1 ml. Apres quatre jours a 37°C dans une atmosphere 
humide a 10 % de fceneur en C02, les macrophages ont ete 
rinc&s et reincub6s pendant deux a quatre jours 
suppl€mentaires . Les cellules d*un puits contrfile ont et£ 
lys6es avec du triton x 100 k 0,1 % dans I'eau et les 
25 noyaux 6numfir6s. Environ 5 x 10$ cellules adh6rentes ont 
€te comptees. Pour 1» infection, M. emegmatis portant les 
differents plasmides a §t6 cultivS en pleine phase 
exponentielle (DOgoOnm entre 0,4 et 0,8) et dilu£ jusqu'S 
une DO de 0,1 puis 10 fois dans un milieu pour macrophage. 
30 1 ml a 6t£ ajout6 S chaque puits et les plaques ont 6t6 
centrifugfies et incubees quatre heures £ 37°C. Aprds trois 
lavages, les cellules ont 6te incubfies dans un milieu 
contenant de 1'amykacine pendant deux heures. Apres trois 
nouveaux lavages, les cellules infectfees adh6rentes ont 6t6 
35 incubees dans un milieu macrophage pendant une nuit. Les 
cellules ont ensuite 6te lysSes dans 0,5 ml de tampon de 
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lyse (Promega) . 100 fxl ont 6t6 soniqu£s et la lumidre Smise 
a 6t6 mesur6e sur 25 jinu Simultan6ment , les bact§ries ont 
&t& 6nura£r6es par 6talement sur L-agar-kanamycine (20 
/xg/ml~ 1) . La lumiSre 6mise est exprim6e en ULR/10 3 
5 bact£ries. 

Analyses des banques de donn6es 

Les sequences nucl6otidiques ont 6t6 compar6es a 
10 EMBL et GenBank en utilisant l'algorithme FASTA et les 
sequences proteiques ont ete analysees par similitude 
gr§ce aux banques de donnees PIR et Swiss Prot en utilisant 
1'algorithme BLAST . 

15 Exemple 1 : Les vecteurs pJVED 

Les vecteurs pJVED (Figure 51) sont des plasmides 
portant un gene phoA tronqu6 de E. coli d£pourvu de codon 

d* initiation, de sequence signal et de sequence 
20 regulatrice. Le site multiple de clonage (SMC) permet 
1' insertion de fragments des genes codants pour 
d'Sventuelles prot6ines exportees ainsi que leurs sequences 
de regulation. D&s lors, la proteine de fusion peut etre 
produite et presenter une activity phosphatase alcaline si 
25 elle est exportee. Seules les fusions en phase pourront 
etre productive^. Ainsi, le SMC a 6t£ modifi£ de sorte que 
les fusions peuvent £tre obtenues dans six phases de 
lecture. En aval de phoA, le g&ne luc de la lucif6rase de 

luciole a 6t6 ins€r6. Le gene complet avec le codon 
30 d'initiation mais sans qu'aucun prornoteur n'ait et6 utilise 
devrait ainsi s'exprimer avec phoA comme dans un op€ron 

synth£tique, Un nouveau site de liaison des ribosomes a 6t6 
Ins6r6 huit nucleotides en amont du codon d'initiation de 
luc. Deux terminateurs transcript ionnels sont presents dans 
35 les vecteurs pJVED, un en amont du SMC et un second en aval 
de luc. Ces vecteurs sont des plasmides de transfert E, 
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coli -mycobacterium avec un gene de resistance a la 
kanamycine comme marqueur de selection. 



ma is 



phoA et luc fonctionnent comme dans un opSron, 
1 • exportation est n^cessaire pour 1' activity phoA. 

Quatre plasmides ont ete construits par insertion 
dans le SMC de fragments d'ADN d'origine diverse : 

Dans la premiere construction nommee pJVED/blaF, le 
fragment de 1,4 kb provient du plasmide deja decrit P LA7i 
(Lim et al., X99S) . Ce fragment issu du gene P-lactamase 
(blaF) de M. fortuitum D216 (Timm et al . , 1994) inclut le 
promoteur mute hyperactif, le segment codant pour 32 acides 
amines de la sequence signal et les 5 premiers acides 
amines de la proteine mature. Ainsi cette construction 
inclut le promoteur le plus fort connu chez mycobacterium 
et les elements necessaires a 1 • exportation de la proteine 
de la fusion phoA. Par consequent, on peut attendre de 
cette construction une forte emission de lumiere et une 
bonne activit6 phoA (cf figures 53 et 54). 

Dans une deuxieme construction nommee pJVED/hsplS, 
un fragment de 1,5 kb a ete clone a partir du plasmide deja 
decrit PPM1745 (Servant et al . , 1995). Ce fragment inclut 
les nucleotides codants pour les dix premiers acides amines 
de la proteine de choc thermique de 18 kb issue de 
Streptomyces albus (heat shock protein 18, HSP 18) , le site 
de liaison du ribosome, le promoteur et, en amont, des 
sites regulateurs contr61ant son expression. Cette proteine 
appartient a la famille de alpha-crystalline de HSP a 
faible poids mol6culaire (Verbon et al . , 1992). Son 
homologue issu de M. leprae, l'antigene de 18 kDa, est deja 
connu pour etre induit durant la phagocytose par un 
macrophage murin de la llgnee cellulaire J-774 
(Dellagostinet al . , 1995). Dans des conditions de culture 
standard, le pJVED/hspie, montre une faible activite luc et 
aucune activite phoA (cf figures 53 et 54) . 
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Dans une troisidme construction, notnm6e 
pJVED/ P19kDa, 1* insert issu de pExp410 (Lim et al . , 1995) a 
6t6. coup6 et clon€ dans le SMC de pJVED a - Ce fragment 
inclut les nucleotides codants pour les 134 premiers acides 

5 amines de la protfiine connue de M. tuberculosis 19 kDa et 
de ses sequences r^gulatrices . Comma cela a pu etre mis en 
Evidence , cette protSine est une lipoprotfiine glycosyl6e 
(Garbe et al., 1993 ; Herrmann et al., 1996), Sur les 
figures 53 et 54, on observe, pour cette construction, une 

K) bonne activity luc eorrespondant i un promoteur fort, mais 

I'activite phoA est la plus forte des guatre constructions* 

L' activity phoA £lev6e de cette protfiine de fusion avec une 

lipoprotSine s'explique par le fait qu'elle reste attachee 
a la paroi cellulaire par son extr&mitfi N- terminal. 
15 Dans la quatrielme et dernidre construction nommfie 

pJVED/erp 1' insert provient de pExp53 (Lim et al., 1995) et 

a 6t€ clone dans le SMC de pJVEDa* pExp53 est le plasmide 
initial selectionn6 pour son activit6 phoA et contenant une 
partie du g6ne erp de W. tuberculosis qui code pour un 

20 antig&ne de 28 kDa, Ce dernier inclut la sequence signal, 
une partie de la prot£ine mature et, en amont du codon 
d' initiation, le site de liaison de ribosome. Le promoteur 
a et£ cartographies Une boite fer (iron box) putative du 
type fur est prSsente dans cette region et encadre la 

25 region -35 du promoteur (Berthet et al . , 1995) , Comme 
prevu (figures 53 et 54) cette construction presente une 
bonne emission lumineuse et une bonne activity phoA. Le 

fait que cette prot§ine de fusion, contrairement I la 
fusion avec la lipoprotfeine de 19 kDa, ne semble pas 
30 attachSe & la paroi cellulaire n'exclut pas que la proteins 
native y soit associ6e. De plus, I l extr6mit6 C- terminal de 
erp est absente de la prot6ine de fusion. 

Exemple 2 : Construction d'une banque d'ADN g6nomique de 
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M. tuberculosis dans les vecteurs pJVEDg et identification 
d'un des membres de ces banques, (DP428) , induit au cours 
de la phagocytose par les macrophages murins derives de la 
moelle osseuse. 

5 Les diff6rentes constructions sont testees pour 

leur capacity a ^valuer 1' expression intracellulaire des 
gdnes identifies par 1* expression de phoA. Dans cet 

objectif, I'activite Juc est exprim£e en URL pour 103 
bacteries en culture ax£nique et/ou dans des conditions 

10 intracellulaires . L' induction ou la repression suivant la 
phagocytose par les macrophages murins derives de la moelle 
osseuse peut etre £valuee convenablement par la mesure des 
activit6s specif iques. Les resultats de deux experiences 
distinctes sont pr§sent<§s dans le tableau 2. 

15 Le plasmide pJVED/hsplfl a ete utilise comme 

controle positif pour 1* induction durant la phase de 
croissance intracellulaire. Bien que 1* induction du 
promoteur par le chauffage de la bactSrie & 42°C n'ait pas 
6t6 concluant la phagocytose de la bactferie conduit 
20 clairement a une augmentation de 1' activity du promoteur, 
Dans toutes les experiences, l'activite luc intracellulaire 

a ete fortement induite, augmentant de 20 a 100 fois 
l'activite basale initialement faible (Servant, 1995). 

Le plasmide pJVED/blaF a ete utilise comme contr&le 

25 de la modulation non specif ique au cours de la phagocytose, 
De faibles variations ont pu etre mises en evidence, 
probablement dues a des changements de conditions de 
cultures. Quoi qu'il en soit, ces faibles variations ne 
sont pas comparables a 1' induction observee avec le 

30 plasmide pJVED/hsp!8. 

Tous les membres de la banque d'ADN ont ete testes 
par mesure de l'activite du promoteur ' durant la croissance 
intracellulaire, Partni eux, le DP428 est fortement induit 
au cours de la phagocytose (tableaux 1 et 2) , 



WO 99/09186 



PCT/FR98/01813 



TABLEAU 1 



84 



10 



15 



Construction 



pJVED//Myj/A> 
piVEDIDNM 



Construction 



pJVBD/A/aP 



pJVEDfhs()I8 



pWRD/DPm 



% Recuperation 



% Recuperation 
C57BL/6 Balb/C 



i.1 



6.7 



1,7 



1.6 



2.1 



URL/10 1 
bactcrics 
cxtraccllulaire 



1460 



URL/ 10* 
bactcries 
intraccllulaire 



8 



0.06 



1727 



57 



18 



URL/I 0* 
bactcrics 
cxtraccllulaire 



662 



164 



0.08 



URL/10 3 
bactcrics 
intraccllulaire 
C57BL/6 Balb/C 



250 



911 



261 



325 



1.25 



3,3 



Induction 



1.2 



7.1 



300 



Induction 
C57BL/6 Balb/C 



0.4 



1.4 



1.6 



15.6 



41 



5 TABLEAU 2 



Construction 



pJVED/A/g/^ 
pWED/tispl8 



% Recuperation 



22 



21 



URL/10 1 
bactcrics 
cxtraccllulaire 



1477 



0.26 



0,14 



UR17I0 1 
bactcrics 
intraccllulaire 
367 



6.8 



Induction 



0.25^ 
26 



28 



he fragment nucleotidique codant pour la region N - 
termmale du polypeptide DP428 de sequence SEQ ID N<- 28 est 
contenu dans le plasmide depose a la CNCM sous le N° i- 

DP428 L a TtTT ^ U S ' qU6nCe C ° dant P ° Ur 16 
DP428 a ete obtenue comme detaillee ci-apres. 

Une sonde a ete obtenue par PGR 'a 1-aide des 
oligonucleotides de sequence SEQ ID N° 25 et SEQ ID N° 26 
Cette sonde a ete marquee par extension aleatoire en 
presence de »P dCTP. Une hybridation de l^N genomique de 
M. tuberculosis souche Mtl03 prealablement digere par 
l'endonuclease Seal a ete realise a i. aide de ladite 
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sonde. Les r6sultats de 1 1 hybridation ont fait apparaltre 
qu'un fragment d'ADN d' environ 1,7 kb £tait marqu£. Du fait 
qu'il existe un site Seal s*6tendant du nucleotide nt 984 
au nucleotide nt 989 de la sequence SEQ ID N° l # e'est-a- 
5 dire du c3te 5 % de la sequence utilises comme sonde, la fin 
de la sequence codante est necessairement pr4sente dans le 
fragment detects par hybridation, 

L'ADN g£nomique de la souche Mt 103 de M. 

tuberculosis, apr&s digestion par Seal, a subi une 

10 migration sur un gel d' agarose. Les fragments de tailles 
comprises entre 1,6 et 1,8 kb ont 6t£ clones dans le 
vecteur pSL1180 (Pharmacia) pr6alablement cliv6 par Seal et 
dephosphoryie . Apr&s transformation de B. colx avec les 

vecteurs recombinants resultants , les colonies obtenues ont 
15 6t6 cribl6es h l'aide de la sonde. Le criblage a permis 

d'isoler six colonies hybridant avec cette sonde. 

Les inserts contenus dans les plasmides des clones 

recombinants pr6c6demment select ionnes ont ete sequences, 

puis les sequences align^es de maniere a determiner la 
20 totality de la sequence codant pour DP428, plus 

sp§cif iquement la SEQ ID N° 2. 

Un couple d' amorces a ete synth£tis£ afin d' amplifier, 

5 partir de I'ADN gfenomique de M. tuberculosis, souche Mt 

103, la totality de la sequence codant pour le polypeptide 
25 DP428. L'amplicon obtenu a ete clone dang un vecteur 
d 1 expression. 

Des couples d 1 amorces appropries pour 1 1 amplification 
et le clonage de la sequence codant pour le polypeptide 
DP428 peuvent §tre ais£ment realises par l*homme du mitier, 
30 sur la base des sequences nucl£otidiques SEQ ID N°l et SEQ 
ID N°2, 

Un couple d* amorces particulier selon 1' invention est 
le couple d 1 amorces suivants, capable d 1 amplifier I'ADN 
codant pour le polypeptide DP428 depourvu de sa sequence 
35 signal : 
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- Amorce aller (SEQ ID N° 29) , comprenant la sequence 
allant du nucleotide en position nt 1021 au nucleotide nt 
1044 de la sequence SEQ ID N° 2 : 
5' - AGTGCAT GCTQCTGGCCGAACCATCAGCGAC - 3 V 

5 

~ Amorce re tour (SEQ ID N° 30) , comprenant la sequence 
complement a ire de la sequence allant du nucleotide en 
position nt 1345 au nucleotide en position nt 1325 de la 
Sequence SEQ ID N° 2 : 
10 5 1 - CAGCCAGATCT GCGGGCGCCCTGC ACCGCCTQ - 3', 

dans lesquelles la partie soulignee represente les 
sequences hybridant specif iquement avec la sequence SEQ ID 
N° 2 et les extremites 5' correspondent a des sites de 
15 restriction en vue du clonage de l'amplicon resultant dans 
un vecteur de clonage et/ou d' expression. 

Un vecteur particulier utilise pour 1' expression du 
polypeptide DP428 est le vecteur pQE70 commercialise par la 
societe Qiagen. 

20 

Exemple 3 : La sequence complete du g£ne DP428 et de ses 
regions flanquantes. 

Une sonde de la region codante de DP428 a £te 
25 obtenue par ACP, et utilisee pour hybrider l'ADN genomique 
de differentes esp^ces de mycobacteries , D'aprds les 
resultats de la figure 3 # le gene est present uniquement 
dans les mycobacteries du complexe de M. tuberculosis, 

L' analyse de la sequence suggere que DP428 pourrait 
30 faire partie d'un op6ron. La sequence codante et les 
regions flanquantes ne presentent aucune homologie avec des 
sequences connues deposees dans les banques de donnees. 

D»apr£s la sequence codante, ce gene code pour une 
proteine de 10 kDa avec un peptide signal, une extremite O 
35 terminal hydrophobe terminee par deux arginines et precgdee 
par un motif LPISG semblable au motif connu LPXTG. Ces deux 
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arginines pourraient correspondre a un signal de retention 
et la prot6ine DP428 pourrait §tre accroch£e par ce motif a 
des peptidoglycanes comme cela a d£ja 6t& d£crit chez 
d'autres bactSries Gram* (Navarre et al., 1994 et 1996). 

5 Le m6canisme de survie et de croissance 

intracellulaire des mycobactferies est complexe et les 
relations intimes entre la bacterie et la cellule hote 
restent inexpliqu6es. Quel que soit le m6canisme, la 
croissance et la survie intracellulaire des mycrobact6ries 

10 depend de facteurs produits par la bacterie et capables de 
moduler la rSponse de l'h&te.-Ces facteurs peuvent Stre des 
molecules expos^es £ la surface cellulaire telle que LAM ou 
des protSines associees a la surface cellulaire, ou des 
molecules activement secretfies. 

15 D'un autre cot6, intracellulairement , les bacteries 

elles-memes doivent faire face & un environnement hostile. 
El les semblent y rfipondre par des rooyens proches de ceux 
mis en oeuvre dans les conditions de stress, par 
1' induction de prolines de choc thermique (Dellagostin et 

20 al., 1995), mais aussi par induction ou la repression de 
diffSrentes prolines (Lee et al . , 1995), En utilisant une 
m^thodologie d€rivee de la PCR, Plum et Clark-curtiss (Plum 
et al., 1994) ont montr£ qu'un gSne de M. avium inclu dans 

un fragment d'ADN de 3 kb, est induit apres la phagocytose 
25 par des macrophages humains, Ce gine code pour une proteine 
export6e comprenant une sequence leader mais ne prfesentant 
pas d'homologie significative avec les sequences proposees 
par les banques de donn6es. L' induction, pendant la phase 
de croissance intracellulaire, d'une protSine de choc 
30 thermique de faible poids mol&culaire issue de M. leprae a 

figalement et6 mise en Evidence (Dellagostin et al., 1995). 
Dans une autre 6tude, les protdines bactferiennes de M. 

tuberculosis ont 6te m^taboliquement marquees pendant la 

phase de croissance intracellulaire ou bien dans des 
35 conditions de stress et separSes par Slectrophorese sur gel 
& deux dimensions : 16 prot6ines de M. tuberculosis ont ete 
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induites et 28 reprim&es. Les memes prolines sont mises en 
jeu au cours de stress provoqug par un faible pH, un choc 
thermique, H2O2, ou au cours de la phagocytose par des 
monocytes humains de la lign6e THP1 . Quoi qu'il en soit, le 

5 comportement des protfiines induites et r6prim6es £tait 
unique dans chaque condition (Lee et al . , 1995). Pris 
ensemble, ces rSsultats indiquent qu'un dialogue 
molfeculaire subtile est mis en place entre les bact6ries et 
leurs hotes cellulaires. De ce dialogue depend probablement 

U) le sort de I'organisme intracellulaire . 

Dans ce contexte, l 1 induction de 1* expression de 
DP428 pourrait etre d'une importance majeure, indiquant un 
r61e important de cette prot6ine dans la survie et la 
croissance intracellulaire. 

15 La m6thode utilis£e dans ces experiences pour 

^valuer l 1 expression intracellulaire des genes (cf. Jacobs 
et al., 1993, pour la methode de determination de 
1* expression de la lucif6rase de luciole, et Lim et al . , 
1995, pour la m£thode de determination de 1' expression du 

20 gene PhoA) pr^sente l'avantage d'etre simple comparSe aux 

autres techniques comme la technique d£crite par Mahan et 
al. (Mahan et al., 1993} adapt£e aux mycobact6ries et 
propos6e par Bange et al . (Bange et al . , 1996), ou la 
methode substractive bas6e sur l'ACP decrite par Plum et 

25 Clark-curtiss (Plum et al . , 1994). 11 existe 
indiscutablement une variability comme le montre la 
comparaison des diff6rentes experiences. Bien que provoquer 
1' induction ou la repression soit suffisant, il est 
dSaormais possible de l'6valuer fournissant ainsi un outil 

30 supplementaire d'§tudes physiologiques des prolines 
exportSes identifies par fusion avec phoA. 

Exemple 4 : 

Recherche d l une modulation de I'activite des promoteurs 
35 lors des phases intramacrophagiques . 
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Des macrophages de moelle osseuse die souris sont 
pr£par6s comme dScrit par Lang et Antoine (Lang et al., 
1991) . Les bacteries de M. segmentis recombinantes, dont on 

a determine l 1 activity lucif6rase par 10 3 bacteries comme 
5 pr6c6demment , sont incubfies a 37°C sous atmosphere 
humidifi^e et enrichie en CO2 & 5%, pendant 4 heures en 
presence de ces macrophages de telle manidre qu'elles 
soient phagocytes. Apr&s rin<?age pour £liminer les 
bacteries extracellulaires restantes, on ajoute au milieu 
10 de culture de l'amikacine (100 iig/ml) pendant deux heures. 
Apres un nouveau rin<?age, le milieu est remplacfi par un 
milieu de culture (DMEM enrichi de 10 % de s6rum de veau et 
2 mM de glutamine) sans antibiotiques . Aprds une nuit 
d' incubation comme pr6c6demment , les macrophages sont lysSs 
15 & froid (4°C) a l*aide d*un tampon de lyse (cee lysis 
buffer, Promega) , et l*activit£ lucif€rase par 10 3 
bacteries d6termin€e. Le rapport des activit6s & la mise en 
culture et apr&s une nuit donne le coefficient d 1 induction. 

20 Exemple 5 : 

Isolement d'une s6rie de sequences par s6quen<;age 
directement k partir des colonies. 

Une s&rie de sequences permettant 1' expression et 
25 1* exportation de phoA ont 6t6 isol^es a partir de 1 1 ADN de 

M, Tuberculosis ou de M. Bovis BCG. Parmi ce groupe de 

sequences, deux d'entre el les ont et£ d'avantage 6tudi£es, 
les gSnes entiers correspondant aux inserts ont 6t6 clones, 
sequences, et des anticorps contre le produit de ces g^nes 
30 ont servi & montrer en microscopie 61ectronique que ces 
gdnes codaient pour des antigenes retrouv6s & la surface 
des bacilles de la tuberculose* L'un de ces g&nes erp 

codant pour une sequence signal d* exportation consensus, 
1* autre des ne possedait aucune caractSristique de g£ne 

35 codant pour une prot€ine export€e, d 1 apres la sequence, Un 
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autre gene DP428 a 6te sequence avant que la sequence du 
gSnome de M. Tuberculosis ne soit disponible* II contient 

une sequence ressemblant a la sequence consensus 
d' attachement au peptidoglycane, ce qui suggere qu'il 

5 s^agit auasi d'un antigene vraisemblablement retrouve d la 
suface des bacilles de la tuberculose, L* etude des trois 
g£nes erp, des, et celui codant pour DP428 montre que le 
systdme phoA que nous avons developpe chez les 
mycobactSries permet de rep6rer des genes codant pour des 

K) proteine exportees sans determinant reperable par des 
etudes in silico. Ceci est particuli&rement vrai pour les 

polypeptides qui ne possddent pas de sequence signal 
consensus (des) ou non pas de similarity avec des proteines 

de fonction connue (erp et DP428) . 

15 

Un certain nombre d 1 inserts ont 6t£ identifies et 
sequences avant la connaissance du genome de M. 

Tuberculosis, d'autres aprds, Ces sequences peuvent etre 

consid^rees comme des amorces permettant de rechercher des 
20 g£nes codant pour des proteines exportees. A ce jour, une 
serie d' amorces ont £t6 sequenc^es et les g&nes entiers 
correspondants ont €t6 soit sequences, soit identifies 
d*apres la sequence publi£e du genome. Pour tenir compte 
des erreurs de s€quen<;age toujours possibles, les regions 
25 en amont ou en aval de certaines amorces ont ete 
consid6r§es comme pouvant faire partie de sequences codant 
pour des proteines exportees. Dans certains cas des 
similaritgs avec des genes codant pour des proteines 
export6es ou des sequences caracteristiques de signaux 
30 d* exportation ou des caracteristiques topologiques de 
proteines membranaires ont 6t6 detectees. 

Des sequences amorces s'avdrent correspondre S des 
gdnes appartenant a des families de genes possedant plus de 
35 50 % de similarite. On peut ainsi indiquer que les autres 
g£nes detectes par similarite avec une amorce codent pour 
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des prolines export6es. C'est le cas de la sequence SEQ ID 
N° 8G et SEQ ID N° 8H possSdant plus de 77 % de similarity 
avec SEQ ID N° 8A' . 

Les sequences pouvant coder pour des proteines 
5 export£es sont les suivantes : SEQ ID N° 1, 8, 9, 8G, 8H, 
13, 3, 10, 19, 20, 6, 16, 22, 23, 24, 39, 44, 46, et 50. 

Des g&nes identifies d'aprds les amorces a partir de 
la sequence du genome n'ont aucune caract6ristique (d'aprds 
10 la sequence) de prolines export^es. II s'agit des 
sequences suivantes : SEQ ID N° 4, 27, 11, 12, 14, 7, 15, 
17, 18, 21, 31, 32, 33, 34, 35, 36, 37, 38, 40, 41, 42, 43, 
45, 47, 48, et 49. 

15 1 D'apr^s la sequence d'autres organismes comme E. coli, 

on peut rechercher dans la sequence du genome de M. 

tuberculosis t des g&nes poss^dant des similar it^s avec des 

proteines connues pour etre exportSes chez d'autres 
organismes bien que ne poss6dant pas de sequence signal 
20 d 1 exportation. Dans ce cas une fusion avec phoA est un 

protocole avantageux pour determiner si ces sequences de M. 

tuberculosis codent pour des protfeines export6es bien que 

ne presentant pas de sequence signal consensus. II a et6 en 
effet possible de doner SEQ ID N° 49, une sequence 
25 similaire £ un g&ne de E. coli de la famille htrA> Une 

fusion de SEQ ID N° 49 avec phoA conduit a 1* expression et 
h. 1 'exportation de phoA. Des colonies M+ smegmatis 
hSbergeant une fusion SEQ ID N° 49 phoA sur un plasmide 
pJVED sont bleues. 
30 SEQ ID N 6 49 est done consider6e comme une prot6ine 

exportee. 

La mSthode phoA est done utile pour d§tecter d r apres 

la sequence de M. Tuberculosis des gdnes codant pour des 

proteines exportSes sans qu'ils ne codent pour des 
35 sequences caracteristiques des proteines export£es. 
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Meme si une sequence possede des determinants de 
prot6ines exportees, cela ne demontre pas une exportation 
fonctionnelle. Le systeme phoA permet de montrer que le 
gene suspecte code reellement pour une proteine exportee. 
5 Ainsi, il a ete verifie que la sequence SEQ ID N° 50 
possSdait bien des signaux d' exportation. 



TABLEAU 3 



SEQ ID N Q 


Reference de la 
sequence 

correspondante predite 
par Cole et al. \ 




Annotation 


SEQ ID N°l 


Rv 0203 


* 


Sequence hydrophobe en 
N-terminal 


SEQ ID N°4 
SEQ ID N°27 


Rv 2050 




Pas de prediction 


SEQ ID N°8 
SEQ ID N°9 


Rv 2563 




Proteine membranaire 


SEQ ID N° 
8G\H' 


Rv 0072 




Possible proteine de 
transport transmembranaire 
de type ABC 


SEQ ID N°ll 


Rv 0546c 


ML 


Protein S-D Lactoyl 
Glutathione-methyl 
glyoxal lyase 


SEQ ID N°12 


pas de prediction 




non retrouve dans 
W. tuberculosis H37rv 


SEQ ID N°13 
SEO ID N 6 3 
SEQ ID N°10 






probable precurseur 
cutinase avec une sequence 
signal N-terminale 


SEQ ID N°14 
SEQ ID N°7 


pas de prediction 




pas de prediction 


SEQ ID N°15 


avec d^calage de 
lecture, pourrait etre 
en phase avec Rv 2530c 




pas de prediction 


SEQ ID N°17 


Rv 1303 


ML 


pas de prediction 


SEQ ID N°18 


Rv 0199 


ML 


pas de prediction 


SEQ ID N°19 


Rv 0418 


★ 


site de fixation de lipo- 
proteine membranaire 
procaryote, similarite avec 
la N-ac6tyl puromycyne 
acetyl hydrolase 


SEQ ID N°20 
SEQ ID N°6 


Rv 3576 


* 


contient un site de 
fixation de lipoproteine 
membranaire procaryote , 
similarite avec une 
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s6rine/thrdonine proline 
kinase 


SEQ ID N° 21 


Rv 3365c 


ML 


similarit6 avec une m6tallo 
P5Ey^f? e ^ zinc 


SEQ ID N'3! 


non pr6dite 


** *~ -- 


pas do pr6diction 


SEQ ID N°32 


Rv 0822c 


ML 


dxihience d une region 
consensus avec la famille 
drac 


SEQ ID N°33 


Rv 1044 




_pas de prediction 


SEQ ID N°34 


non predite 


■ ■ 


pas de prediction 


SEQ ID N°35 


Rv 2169c 




pas de prediction 


SEQ ID N°36 


Rv 3909 


Mr 
ML 


pas de prediction 


SEQ ID N°37 


Rv 2753c 




similarity avec des 

dihydropricolinate 

syncnases 


SEQ ID N*38 


Rv 0175 




pas de prediction 


SEQ ID N°39 


Rv 3006 


* 

ML 


prediction de sequence 
_signai oe ixpoproteine 


SEQ ID N°40 


Rv 054 9c 




pas de prediction 


SEQ ID N°41 


Rv 2975c pouvant etre 
en phase avec Rv 2974c 




similarite avec proteine de 

aUDb L1JL JLS 


SEQ ID N°42 


Rv 2622 




similarite avec une methyl 
transferase 


SEQ ID N°43 


Rv 3278c 


ML 


pas de prediction 


SEQ ID N°44 


Rv 0309 


* 


pas de prediction 


SEQ ID N°45 


Rv 2169c 


ML 


pas de prediction 


SEQ ID N*4 6 


Rv 1411c 




probable lipoproteine 
avec une sequence signal 
N-terminale 


SEQ ID N°47 


Rv 1714 




similarite avec une 
gluconate 3-d6hydrogenase 


SEQ ID N°48 


Rv 0331 




similarity au^t nnn _ . , ^ p * i 
dehydrogenase et une 
sulfide quinone reductase 


SEQ ID N°4 9 


Rv 0983 


ML 


Similarite avec une serine 
protease HtrA 
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SEQ ID N°5 




— 




SEQ ID N°16 


Rv 3810 


* 

ML 


Prot6inc de surfaces 
Derthelct ct al. 1995 


SEQ ID N°22 
SEQ ID N°23 
SEQ ID N°24 


Rv 3763 


A 


Contient un sTte do 
fixation de linoDroteinu 
membranaire eucaryote 


SEQ ID N°50 


Rv 0125 




Site actif des serines 
proteases 

Sequence signal N-terminale 
possible 



L6gende du tableau 3 : 

Correspondance des sequences selon !• invention avec les 
sequences prSdites par Cole et al . 1998, Nature, 393, 537. 
5 544. 

* : Prediction que la proline codee par la sequence 

soit exportee 
ML : Prediction de similarity avec M. leprae. 

10 Exemple 6 : 

Caracteristiques et obtention de la prot6ine M1C25 



15 



20 



L'extrimite N terminale de la prot6ine M1C25 a 6t€ 
d6tect6e par le systeme PhoA comme permettant 1 1 exportation 

de la proteine de fusion, n6cessaire a l 1 obtention de son 
activite phosphatase. 

La sequence d* ADN codant pour l'extremite N terminale de 
la proteine M1C25 est contenue dans la sequence SEQ ID N° 
20 de la pr6sente demande de brevet. 

A partir de cette sequence amorce, le gene complet 
codant pour la proline M1C25 a ete recherchS dans le 
genome de M. tuberculosis (Fondation Welcome Trust, site 
Sanger) . 

Le centre Sanger a attribue & M1C25 les noms: 
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Rv3576, 

MTCY06G11.23, 

pknM 

5 Sequence SEP ID N° 29 du gdne complet M1C25 (714 bases) : 
cf. Figure 29 

Ce g&ne code pour une protfiine de 237 AA, de 25 kDa de 
masse molaire. Cette protfiine est r6f6renc6e dans les 
!0 banques sous les appellations: 
PID;e306716, 
SPTREMBL:P96858 

Sequence SEP ID N° 30 de la prot£ine M1C25 (237 acides 
15 amines) : cf. Figure 30 

M1C25 contient un site de fixation S la partie 
lipidique des lipoprot£ines de membrane des procaryotes 
(PS00013 ProJcaryotic membrane lipoprotein lipid attachment 
20 site: 

CTGGTCGGTG CGTGCATGCT CGCAGCCGGA TGC) . 

La fonction de M1C25 n'est pas certaine mais elle 
poss&de trfes probablement une activiti 11 serine /threonine - 
protdine kinase" . Des ressemblances sont i. noter avec la 
25 moitie C terminale de K08G_MYCTU Q11053 Rvl266c 
(MTCY50.16). Des similarity sont aussi retrouv6es avec 
KY28J1YCTU. 

En 5' du g&ne codant pour M1C25 se trouve un gene 
codant potentiellement pour une proteine regulatrice 
30 (PID:e306715, SPTREMBL: P96857 , Rv3575c, (MTCY06G11 . 22c) ) 

Le profil d' hydrophobic^ (Kyte et Doolitle) de M1C25 
est represents S la figure 56, 

Un site de clivage de la sequence signal est pr£dit 
(SignalP VI. 1; World Wide Web Prediction Server, Center for 
35 Biological Sequence Analysis) entre les acides aminfes 31 et 
32: AVA-AD. Ce site de coupure est derri&re un motif " AXA" 
classique, Cette prediction est compatible avec le profil 
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d'hydrophobicitS. Dans cette sequence signal potent ielle il 
est a remarqu£ la r6p6tition trois fois de la sequence des 
trois acides amines? LAA. 

Clonage du g&ne M1C25 en vue de la production de la 
protfiine qu'il code: 

Un couple d 1 amorces a 6t6 synth6tis6 afin d* amplifier, 
a partir de I'ADN g6nomique de M. tuberculosis, souche 
H37Rv, la totality de la sequence codant pour le 
polypeptide M1C25. L'amplicon obtenu a §t£ cionS dans un 
vecteur d* expression. 

Des couples d' amorces appropri6s pour 1 1 amplification 
et le clonage de la sequence codant pour M1C25 ont 6t6 
synthgtises : 
-amorce aller : 

5 1 - ATAATACC ATGGGCAAGCAGCTAGCCGCGC - 3» 
-amorce re tour : 
20 5 ' - ATTTATAGATCT CTGCTTAGCAACCTTGGCCGCG - 3 1 

La partie soulign£e reprfisente les sequences hybridant 
sp6cif iquement avec la sequence M1C25 et les extr6mites 5 1 
correspondent £ des sites de restriction en vue du clonage 
25 de l'amplicon r6sultant dans un vecteur de clonage et/ou 
d' expression/ 

Un vecteur particulier utilise pour 1 1 expression du 
polypeptide M1C25 est le vecteur pQE60 commercialism par la 
societe Qiagen, en suivant le protocole et les 
30 recommandations proposes par cette marque. 

Les cellules utilis6es pour le clonage sont des 
bact6ries : E. coli XLl-Blue (rSsistante a la 
tetracycline) . 

Les cellules utilis6es pour l 1 expression sont des 
35 bactferies : E. coli M15 (r^sistante a la kanamycine) 
contenant le plasmide pRep4 (MIS pRep4) ♦ 
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La production de la prot£ine MC25 est illustr<§e par les 
figures S7 A et B, ( Ext raits bact£riens de la souche E. 
coli M15 contenant le plasmide pM!C25. Les cultures 
bact6riennes et les extraits sont pr£par£s selon Sambrook 
et al. (1989)* L' analyse des extraits bacr^riens est 
effectu6e selon les instructions de Quiagen (1997) . 
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REVENDXCATIONS 

1. Vecteur recombinant de criblage, de clonage et/ou 
d' expression, caract6ris6 en ce qu'il se r6plique chez des 
5 mycobacterias et en ce qu'il contient : 

1) un r£plicon fonctionnel chez les mycobactSries ; 

2) un marqueur de selection ; 

3) une cassette rapporteur comprenant : 

a) un site de clonage multiple (polylinker) , 
U) b) 6ventuellement un terminateur de transcription actif 
chez les mycobact6ries, en amont du polylinker, 

c) une sdquence nucleotidique codante issue d'un gene 
codant pour un marqueur d' expression, d'exportation et/ou 
de s£cr£tion de prote*ine, ladite sequence nucleotidique 

15 6tant dSpourvue de son codon d' initiation et de ses 
sequences de regulation, et 

d) une sequence nucleotidique codante issue d'un gene 
codant pour un marqueur d 1 activity de promoteurs contenus 
dans le meme fragment, ladite sequence nuc!6otidique 6tant 

20 pourvue de son codon d 1 initiation . 

2. Vecteur recombinant selon la revendication 1, 
caract6ris6 en ce que la sequence nucleotidique codante 
issue d'un g&ne codant pour un marqueur d* expression, 

25 d' exportation et/ou de s6cr6tion de proteine est une 
sequence codante issue du g£ne phoA de la phosphatase 
alcaline. 

3. Vecteur recombinant selon l'une des revendications 1 et 
30 2, caracterise en ce que la sequence nucleotidique codante 

issue d'un g&ne codant pour un marqueur d' expression, 
d' exportation et/ou de secretion de proteine est une 
sequence codante du g&ne de la P-agarase, de la nuclease 
d'un staphylocoque ou de la (J-lactamase d'une mycobact€rie . 
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4. Vecteur recombinant selon l'une deg revendications 1 3 

3, caract6ris6 en ce que la sequence nucl^otidique codante 
issue d'un g&ne codant pour un marqueur d'activite de 
promoteurs contenus dans le meme fragment est une sequence 

5 codante issue du g£ne luc de la lucifSrase de luciole. 

5. Vecteur recombinant selon l'une des revendications 1 & 

4, caract6ris6 en ce que la sequence nucl6otidique codante 
issue d'un gene codant pour un marqueur d' activity de 

10 promoteurs contenus dans le meme fragment est une sequence 
codante issue du g£ne GFP de la Green Fluorescent Protein* 

6. Vecteur recombinant selon l'une des revendications 1 a 

5, caract6ris6 en ce que le terminateur de transcription 
15 actif chez les mycobactSries est le terminateur du 

coliphage T4 (tT4> ♦ 

7. Vecteur recombinant selon l'une des revendications 1 a 

6, caract6ris6 en ce qu'il est un plasmide choisi parmi les 
20 plasmides suivants deposes a la CNCM (Collection Nationale 

de Cultures de Microorganismes, Paris, France) : 

a) pJVEDa d£pos£ a la CNCM sous le N° 1-1797, 
le 12/12/1996, 

b) pJVEDb depose a la CNCM sous le N° 1-1906, le 25 juillet 
25 1997, 

c) pJVEDc depos6 a la CNCM sous le N° 1-1799, le 
12/12/1996. 

8. Vecteur recombinant selon l'une des revendications 1 a 
30 7, caract6ris6 en ce qu'il comprend en Vun des sites de 
clonage du polylinker une sequence d'acide nucl6ique de 
mycobactSrie chez laquelle on detecte un polypeptide 
susceptible d'etre exporte et/ou s6cr6t6, et/ou d'etre 
induit ou reprim§ lors de 1 ' infection par ladite 
35 mycobacterie ou encore exprim£ ou produit de fa<?on 
constitutive, ainsi que les sequences promotrices et/ou 
r£gulatrices associ6es susceptibles de permettre ou de 
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favoriser 1 'exportation et/ou la secretion dudit 
polypeptide, ou tout ou partie de g&ne codant pour ledit 
polypeptide. 

5 9, Vecteur recombinant selon l'une des revendications 1 & 

8, caract6ris£ en ce que la sequence d'acide nuclSique de 
mycobact6rie qu'il contient est obtenue par fragmentation 
physique ou par digestion enzymatique de I'ADN gfinomique ou 
de 1 1 ADN compl6mentaire d'un ARN d'une mycobactgrie . 

10 

10. Vecteur recombinant selon I'une des revendications 1 S 

9, caract6ris£ en ce que ladite mycobact6rie est M. 
tuberculosis* 

15 11. Vecteur recombinant 9elon I'une des revendications l a 
9, caracteris£ en ce que ladite mycobact6rie est choisie 
parmi M. africanum, M. hovis, M* avium ou M. leprae. 

12. Vecteur recombinant selon la revendication 10, 
20 caract6ris6 en ce qu'il est un plasmide choisi parmi les 
plasmides suivants deposes a la CNCM : 

a) p6D7 depose le 28 janvier 1997 k la CNCM sous le N°I- 
1814, 

b) p5A3 deposS le 28 janvier 1997 H la CNCM sous le N°I- 
25 1815, 

c) p5F6 depose le 28 janvier 1997 a la CNCM sous le N°I- 
1616, 

d) p2A29 depos§ le 28 janvier 1997 h la CNCM sous le N°I- 
1817, 

30 e) pDP428 dSposS le 28 janvier 1997 a la CNCM sous le N°I- 
1818, 

f) p5B5 d§pose le 28 janvier 1997 h la CNCM sous le N°I- 
1819, 

g) plC7 d€pos$ le 28 janvier 1997 k la CNCM sous le N°I- 
35 1820, 

h) p2D7 deposS le 28 janvier 1997 a la CNCM sous le N°I- 
1821, 
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i) plB7 depose le 31 janvier 1997 a la CNCM sous le N°I- 
1843, 

j) pJVED/M. tuberculosis d6poa€ le 25 juillet 1997 a la 

CNCM SOUS le N° 1-1907, 
k) pMlC25 depose le 4 aoQt 1998 a la CNCM sous le n°-X-2062. 

13. Vecceur recombinant selon la revendication 12, 
caracterise en ce qu'il s'agit du plasmide pDP428 d£pose le 
28 janvier 1997 a la CNCM sous le N°I-1818. 

10 

14. Proc6d6 de criblage de sequences de nucleotides issues 
de mycobacteries pour determiner la presence de sequences 
correspondant a des polypeptides exportes et/ou secretes 
pouvant etre induits ou reprints lors de I 1 infection, leurs 

15 sequences promotrices et/ou r^gulatrices associees 
suseeptibles notamment de permettre ou de favoriser 
1» exportation et/ou la secretion desdits polypeptides 
d'interet, ou tout ou partie de genes d'interet codant pour 
lesdits polypeptides, caracterise en ce qu'il met en oeuvre 

20 un vecteur selon I'une des revendications l a 13. 

15. Proc6d6 de criblage selon la revendication 14, 
caracterise en ce qu'il comprend les Stapes suivantes : 

a) la fragmentation physique des sequences d* ADN . de 
25 mycobacteries ou leur digestion par au moins une enzyme 

d6termin6e et la recuperation des fragments obtenus ; 

b) I 1 insertion des fragments obtenus a I'etape a) dans un 
site de clonage, compatible le cas echeant avec 1' enzyme de 
l*etape a), du polylinker d'un vecteur selon l'une des 

30 revendications l a 13 ? 

c) si besoin, 1 1 amplification desdits fragments contenus 
dans le vecteur, par exemple par replication de ce dernier 
aprSs insertion du vecteur ainsi modifie dans une cellule 
determinfee, de preference E coli ; 

35 d) la transformation de cellules h6tes par le vecteur 
amplifie a I'etape c) , ou en l'absence d 1 amplification, par 
le vecteur de I'etape b) ; 



W> 99/09186 



PCT/FR98/01813 



109 

e) la culture de cellules hotes transformSes dans un milieu 
permettant la mise en Evidence du marqueur d» exportation 
et/ou de s6er6tion, et /ou du marqueur d 1 activity de 
promoteurs contenu dans le vecteur ; 

f) la detection des cellules hotes positives (colonies 
positives) pour 1* expression du marqueur d 1 exportation 
et/ou de s6cr6tion, et /ou du marqueur d f activity de 
promoteurs ; 

g) I'isolement de l'ADN des colonies positives et 
1' insertion de cet ADN dans une cellule identique & celle 
de 1 ' 6tape c) ; 

h) la selection des insertions contenues dans le vecteur, 
permettant l'obtention de clones positifs pour le marqueur 
d' exportation et/ou de s£cr6tion, et /ou pour le marqueur 
d 1 activity de promoteurs ; 

i) I'isolement et la caracterisation des fragments d* ADN de 
mycobact^ries contenues dans ces inserats, et l»6tape i) du 
proc£de pouvant comporter en outre une 6tape de sfequengage 
des insertions selectionnSes . 

16. Banque d' ADN g6nomique ou d'ADNc complementaire d'ARNm 
de mycobacterie, caract£ris§e en ce qu'elle est obtenue par 
un proc6de selon la revendication 14 et/ou un procedS 
comprenant les 6tapes a) et b) , ou a) , b) et c) du procede 
selon la revendication IS. 

17. Banque d' ADN g6nomique ou d ' ADNc compl§mentaire d'ARNm 
de mycobacterie selon la revendication 16, caract€ris6e en 
ce que ladite mycobacterie est une mycobacterie pathogene. 

18. Banque d ' ADN genomique ou d 1 ADNc complementaire d'ARNm 
de mycobacterie selon la revendication 17, caract£ris£e en 
ce que ladite mycobacterie est une mycobacterie appartenant 
au groupe du complexe Mycobacterium tuberculosis* 
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19. Banque d'ADN g6nomique ou d 1 ADNc compl£mentaire d'ARNm 
de mycobact6rie selon la revendication 18, caract6ris6e en 
ce que ladite mycobactdrie est Mycobacterium tuberculosis, 

5 20. Sequence nuclfeotidique de mycobacteria ou comprenant 
une sequence nucl<§otidique de mycobacteria susceptible 
d'etre s61ectionn6e par un proc6d£ selon I 1 une des 
revendications 14 et 15. 

10 21. Sequence nucl6otidique de mycobact6rie ou comprenant 
une sequence nucl£otidique de mycobact£rie selon la 
revendication 20, caracteris6e en ce que ladite 
mycobacteria est choisie parmi M. tuberculosis, M. bovis, 
M. africanum, M . avium, M. leprae, M . paratuberculosis , M, 

15 kansassi ou M. x§nopi . 

22. Sequence nucl6otidique selon l'une des revendications 
20-21 caracterisee en ce qu'elle est choisie parmi les 
sequences de fragments d'ADN de mycobact^rie de sequence 

20 nucleique SEQ ID N°l a SEQ ID N° 24C, SEQ ID N°27A £ SEQ ID 
N°27C, SEQ ID N°29 et SEQ ID N° 31A a SEQ ID N°50F. 

23. Sequence nucliotidique de mycobact6rie l*une des 
revendications 20-21 caractferisfee en ce qu'elle est choisie 

25 parmi les s6quences de fragments d'ADN de mycobacterie de 
sequence SEQ ID N°l, SEQ ID N*3A, SEQ ID N°SA, SEQ ID N°6A, 
SEQ ID N°7A, SEQ ID N°8A, SEQ ID N°9A, SEQ ID N°10A, SEQ ID 
N°27A ou SEQ ID N°29 contenus respect ivement dans les 
vecteurs pDP428 (CNCM, N°I-1818) , p6D7 (CNCM, N°I-1814), 

30 p5F6 (CNCM, N°I-1816) , p2A29 (CNCM, N°I=1B17) , p5B5 (CNCM, 
N°I-1819) ,plC7 (CNCM, N°I-1820) , p2D7 (CNCM, N°I- 1821) , 
plB7(CNCM, N°I-1843), p5A3 (CNCM, N°I-1815) et pMlC25 
(CNCM, N°I-2062) . 

35 24. Sequence nucleotidique comprenant la totalite du cadre 
ouvert de lecture d'une sequence selon l'une quelconque des 
revendications 20 S 23, 
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25* Polynucleotide caract§ris6 en ce qu'il comprend un 
polynucleotide choisi parmi : 

a) un polynucleotide dont la sequence est compiementaire de 
la sequence d'un polynucleotide selon l'une des 
revendications 20 k 24, 

b) un polynucleotide dont la sequence comporte au moins 50% 
d'identite avec un polynucleotide selon l'une des 
revendications 20 a 24 , 

c) un polynucleotide hybridant dans des conditions de forte 
stringence avec une sequence de polynucleotide selon l'une 
des revendications 20 £ 24, 

d) un fragment d'au moins 8 nucleotides consecutifs d'un 
polynucleotide defini selon l'une des revendications 20 a 

15 24 ou defini en a) . 

26. Polypeptide, leurs fragments ou fragments 
biologiquement act if s ou leurs polypeptides homologues, 
susceptible d'etre code par une sequence nucleotidique de 
20 mycobacterie selon l'une des revendications 20 a 25 # et 
susceptible d'etre exporte et/ou secrete, et/ou induit ou 
r£prime, ou exprime de faqon constitutive lors de 
1 ' infection. 

25 27, Mycobacterie recombinante caract€risee en ce qu'elle 
est transformee par un vecteur recombinant selon l'une des 
revendications 1 S 13, 

28. Polynucleotide dont la sequence est choisie parmi les 
30 sequences nucieotidiques de sequence SEQ ID N°l 5 SEQ ID 

N°2. 

29. Polynucleotide caracterise en ce qu'il comprend un 
polynucleotide choisi parmi ; 

35 a) un polynucleotide dont la sequence est choisie parmi les 
sequences nucieotidiques SEQ ID N°l k SEQ ID N 6 2, 
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b) un polynucleotide dont la sequence nucl£ique est la 
sequence comprise entre le nucleotide en position nt 964 et 
le nucleotide en position nt 1234, extr£mit6s indues, de 
la sequence SEQ ID N°l, 

c) un polynucleotide dont la sequence est compiementaire de 
la sequence d'un polynucleotide defini en a) ou b) , 

d) un polynucleotide dont la sequence comporte au moins 50% 
d'identite avec un polynucleotide d6fini en a), b) ou c) , 

e) un polynucleotide hybridant dans des conditions de forte 
10 stringence avec une sequence de polynucleotide defini en 

a) , b) ,c) ou d) , 

f) un fragment d'au moins 8 nucleotides consecutifs d'un 
polynucleotide defini en a), b) , c) , d)ou e) , 

15 30. Polynucleotide selon I'une des revendications 20 a 25, 
28 et 29, caracterise en ce que sa sequence nucleique 
hybride avec l'ADN de sequence de mycobacteries et 
preferentiellement avec dQ 1 1 ADN de sequences de 
mycobacteries appartenant au complexe de Mycobacterium 

20 tuberculosis, 

31. Polypeptide caracterise en ce qu'il est code par une 
sequence polynucieotidique selon l'une des revendications 
20 a 25. 

25 

32, Polypeptide caracterise en ce qu'il comprend un 
polypeptide choisi parmi : 

a) un polypeptide dont la sequence d'acides amines est 
comprise dans une sequence d'acides amines choisie parmi 

30 les sequences d'acides amines SEQ ID N° 1 a SEQ ID N° 24C, 
SEQ ID N° 27A S SEQ ID N° 28 et SEQ ID N* 30 a SEQ ID N° 
50F, 

b) un polypeptide homologue au polypeptide defini en a) , 

c) un fragment d'au moins 5 acides amines d'un polypeptide 
35 dSfini en a)ou b) , 

d) un fragment biologiquement actif d'un polypeptide defini 
en a) , b) , ou c) . 
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33* Polypeptide dont la sequence d'acides amines est 
comprise dans la sequence d'acides amines SEQ ID N°l ou SEQ 
ID N°2, ou polypeptide de sequence d'acides amines SEQ ID 
3 N°28, 

34 , Polynucleotide caract6ris6 en ce qu'il code pour un 
polypeptide selon 1'un des revendications 32 et 33. 

10 35* Sequence d'acide nucl£ique utilisable comme amorce, 
caracteris6e en ce que ladite sequence est choisie parmi 
les sequences d'acide nucliique de polynucleotide selon 
l'une des revendications 20 a 25, 28 a 30, et 34. 

15 36. Sequence d'acide nuclSique selon la revendication 35, 
caract£risee en ce que ladite sequence est choisie parmi 
les sequences SEQ ID N°25 et SEQ ID N°26. 

37. Sequence d'acide nucl£ique selon l'une des 
20 revendications 35 et 36 pour la detection et/ou 

1 'amplification de sequences nucl^iques. 

38. Sequence d'acide nucl6ique utilisable comme sonde, 
caract6ris€e en ce que ladite sequence est choisie parmi 

25 les sequences d'acide nucl6ique selon l'une des 
revendications 20 a 25, 28 J 30, et 34 , 

39* Sequence d'acide nucl6ique selon la revendication 38, 
caraet€ris§e en ce qu*elle est marquee par un compost 
30 radioactif ou par un compost non radioactif , 

40. Sequence d'acide nuclgique selon l'une des 

revendications 38 et 39, caractSrisSe en ce que celle-ci 

est immobilisfee sur un support, de maniere covalente ou 
35 non-covalente. 
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41. Sequence d'acide nucl£ique selon I 1 une des 
revendications 38 a 40 pour la detection et/ou 
1 1 amplification de sequences nuclfiiques. 

42. Sequence d'acide nuclfiique selon l'une des 
revendications 38 a 41, caract£ris6e en ce que ladite 
sequence est une sequence comprise entre le nucleotide en 
position nt 964 et le nucleotide en position nt 1234, 
extremitfis indues, de la sequence SEQ ID N°l, 

43. Vecteur recombinant de clonage, d'expression et/ou 
d* insertion , caracteris6 en ce qu'il contient une sequence 
d'acide nuclSique de polynucleotide selon l'une des 
revendications 20 i 25, 28 a 30, et 34. 

44. Cellule hote, caraet£ris6e en ce qu'elle est 
transform^ par un vecteur recombinant selon la 
revendication 43. 

45. Cellule bote selon la revendication 44, caract£risee en 
ce qu'il s'agit de la souche de E. coli transformSe par le 
plasmide pDP428 deposS le 28 janvier 1997 a la CNCM sous le 
N°I~1818 ou transform^ par le plasmide pMlC25 d€pos§ le 
4 aoflt 1998 a la CNCM sous le n°I-2062, ou d'une souche de 
Af. tuberculosis, M. bovis ou M, africanum possSdant 
potentiellement tous les systdmes de regulation appropries. 

46. Proc6d6 de preparation d'un polypeptide, caracterise en 
ce qu'il met en oeuvre un vecteur selon la revendication 
43. 

47. Polypeptide recombinant susceptible d'etre obtenu par 
un procedS selon la revendication 46. 

48. Polypeptide hybride, caracterise en ce qu'il comporte 
au mo ins la sequence d'un polypeptide selon l'une des 
revendications 26, 32, 33 et 47 et une sequence d'un 
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polypeptide susceptible d'induire une reponse immunitaire 
chez 1 1 homme ou 1 1 animal . 

49. Polypeptide hybride selon la revendication 48, 
5 earact£ris6 en ce que le polypeptide susceptible d'induire 
une r6ponse immunitaire contient au moins un determinant 
antig^nique capable d'induire une r£ponse humorale et/ou 
cellulaire. 

10 50. Polynucleotide codant pour un polypeptide hybride selon 
l*une des revendications 48 et 49. 

51. Polypeptide hybride selon l'une des revendications 48 
et 49, caract€ris6e en ce qu'il s'agit d'une prot£ine 

IS recombinante obtenue par 1* expression d'un polynucleotide 
selon la revendication 50. 

52. Proc6de pour la detection in vitro d'anticorps dirig6s 
contre une mycobacterie et pr££erentiellement une bacterie 

20 du complexe Mycobacterium tuberculosis dans un 6chantillon 

biologique, caractferise en ce qu'il comprend les 6tapes 
suivantes : 

a) mise en contact de 1 "6chantillon biologique avec un 
polypeptide selon l'une des revendications 26, 32, 33 et 

25 47 ; 

b) mise en Evidence du complexe antig&ne-anticorps forme. 

53* ProcSde pour la detection d'une infection par une 
mycobacterie et prSferentiellement une bacterie du complexe 
30 Mycobacterium tuberculosis dans un mammif&re, caracteris6 

en ce qu'il comprend les 6tapes suivantes : 
a) preparation d'un 6chantillon biologique contenant des 
cellules dudit mammifSre plus particuliSrement des cellules 
du syst&me immunitaire dudit mammif&re et plus 
35 particuli&rement encore des cellules T ; 
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b) incubation de 1 ' gchantillon biologique de I'etape a) avec 
un polypeptide selon l'une quelconque des revendications 
26, 32, 33 et 47 ; 

c) d£tection d f une reaction cellulaire indiquant une 
sensibilisation pr6alable du mammifdre audit polypeptide 
notamment la proliferation cellulaire et/ou la synthase de 
protfeines telles que 1 1 interferon gamma; 

d) detection d*une reaction d* hypersensibilit6 retardfie ou 
de sensibilisation du mammiffere audit polypeptide. 

54, Kit pour le diagnostic in vitro d'une infection par une 
mycobacteria appartenant au complexe Mycobacterium 
tuberculosis, comprenant : 

a) un polypeptide selon l'une des revendications 26, 32, 33 
et 47 ; 

b) le cas 6ch6ant, les r6actifs pour la constitution du 
milieu propice k la reaction immunologique; 

c) les reactifs permettant la detection des complexes 
ant ig&ne- anticorps produits par la reaction immunologique ; 

d) le cas echeant, un echantillon biologique de reference 
(temoin negatif) d£pourvu d' anticorps reconnus par ledit 
polypeptide ; 

e) le cas echeant, un Schantillon biologique de reference 
(temoin positif) contenant une quantity pr£d€termin6e 
d'anticorps reconnus par ledit polypeptide. 

55. Anticorps mono- ou polyclonaux, leurs fragments, ou 
anticorps chim£riquea, caracteris6s en ce qu'ils sont 
capables de reconna£tre specif iquement un polypeptide selon 
l'une des revendications 26, 32, 33 et 47 . 

56. Anticorps selon la revendication 55, caracteris£ en ce 
qu'il s f agit d'un anticorps marqufi. 

57. Proc6d6 pour la detection specif ique de la presence 
d'un antigdne d'une bact&rie du complexe Mycobacterium 
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tuberculosis dans un Echantillon biologique, caractErisE en 
ce qu'il comprend les Stapes suivantes : 

a) mise en contact de 1 1 Echant illon biologique avec un 
anticorps selon l'une des revendications 55 et 56 ; 

b) mise en Evidence du complexe antig&ne-anticorps formE. 

58. Kit pour la detection specif ique de la presence d'un 
antigene d'une bactErie du complexe Mycobacterium 

tuberculosis dans un Echant illon biologique, caractErisE en 

ce qu'il comprend les Pigments suivants : 

a) un anticorps polyclonal ou monoclonal selon l'une des 
revendications 55 et 56 ; 

b) les reactifs pour la constitution du milieu propice a la 
reaction immunologique ; 

c) les reactifs permettant la detection des complexes 
antig&ne-anticorps produits par la reaction immunologique* 

59. ProcEde de d§tection et d 1 identification rapide d'une 
mycobacterie et prEfErentiellement de M. tuberculosis dans 

un echantillon biologique, caractErisE en ce qu'il 
comporte les etapes suivantes : 

a) isolement de 1 1 ADN & partir de 1 1 echantillon biologique 
a analyser, ou obtention d'un ADNc a partir de l'ARN de 
l 1 Echantillon biologique ; 

b) amplification spEcifique de 1 'ADN des mycobactEries 
appartenant au complexe Mycobacterium tuberculosis & 

1'aide d' amorces selon l'une des revendications 35 a 37 ; 

c) analyse des produits d' amplification. 

60. ProcedE pour la detection de bactEries appartenant au 
complexe Mycobacterium tuberculosis dans un Echantillon 

biologique, caractErisE en ce qu'il comprend les Stapes 
suivantes : 

a) mise en contact d'une sonde oligonucleotidique selon 
l'une des revendications 38 a 42 avec un Echantillon 
biologique, 1' ADN contenu dans 1 1 Echantillon biologique 
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ayant, le cas EchEant, prEalablement 6t6 rendu accessible & 
1 'hybridation, dans des conditions permettant 1 % hybridation 
de la sonde ^ I'ADN d'une bacteria du complexe 
Mycobacterium tuberculosis ; 

b) detection de l'hybride formE entre la sonde 
oligonuclEotidique et 1 ' ADN de 1 ' Echantillon biologique. 

61, ProcEdE pour la detection de bactEries appartenant au 
complexe Mycobacterium tuberculosis dans un Echantillon 

biologique, caractErisE en ce qu*il comprend les etapes 
suivantes : 

a) mise en contact d'une sonde oligonucleotidique 
immobilisEe sur un support selon la revendication 40 avec 
un echantillon biologique, I 1 ADN de 1 ' Echantillon, ayant, 

15 le cas EchEant, EtE prEalablement rendu accessible 3 
1 1 hybridation, dans des conditions permettant 
1 hybridation de la sonde a 1 1 ADM d'une bactErie du 
complexe Mycobacterium tuberculosis ; 

b) mise en contact de l*hybride forme entre la sonde 
20 oligonucleotidique immobilisee sur un support et 1 1 ADN 

contenu dans 1 ' Echantillon biologique, le cas EchEant 
apres Elimination de 1 1 ADN de 1 1 echantillon biologique 
n* ayant pas hybrids avec la sonde, avec une sonde 
oligonucleotidique marquee selon la revendication 39. 

25 

62. ProcEdE de detection selon la revendication 61, 
caractErisE en ce que, prEalablement 3 l'Etape a), l'ADN de 
1'Echantillon biologique, ou 1'ADNc obtenu par 
transcription inverse de l'ARN de l 1 Echantillon, est 

30 amplifiE a l'aide d'un couple d' amorces selon l'une des 
revendications 35 & 37. 

63. ProcEdE pour la detection de la presence d'une bacterie 
appartenant au complexe de Mycobacterium tuberculosis dans 

35 un Echantillon biologique, caractErisE en ce qu*il comprend 
les etapes suivantes : 
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a) mise en contact de 1 'echantillon biologique avec un 
couple d' amorces selon I'une des revendications 35 £ 37, 
1'ADN contenu dans 1 ' Echantillon ayant 6t<§, le cas 6ch6ant, 
prSalablement rendu accessible ^ 1 1 hybridation, dans des 
5 conditions permettant une hybridation des amorces a I'ADN 
d'une bact6rie du complexe Mycobacterium tuberculosis ; 

b) amplification de 1 1 ADN de la bact6rie du complexe 
Mycobacterium tuberculosis ; 

c) mise en Evidence de 1 1 amplification de fragments d 1 ADN 
10 correspondant au fragment encadr£ par les amorces, par 

exemple par 61ectrophor6se sur gel ou au moyen d'une sonde 
oligonuclSotidique marquee selon la revendication 39* 

64* Proc€d6 pour la detection de la presence d'une bactSrie 
15 appartenant au complexe de Mycobacterium tuberculosis dans 
un echantillon biologique, caractSrise en ce qu'il comprend 
les etapes suivantes : 

a) mise en contact de 1 ' 6chantillon biologique avec deux 
couples d 1 amorces selon l'une des revendications 35 a 37, 
20 1 1 ADN contenu dans 1 Echantillon ayant §te, le cas 
6ch6ant, pr6alablement rendu accessible & 1 1 hybridation, 
dans des conditions permettant une hybridation des amorces 
a 1 1 ADN d'une bactSrie du complexe Mycobacterium 

tuberculosis ; 

25 b) amplification de 1 1 ADN de la bacterie du complexe 
Mycobacterium tuberculosis ; 

c) mise en Evidence de 1 1 amplification de fragments d 1 ADN 
correspondant au fragment encadr6 par lesdites amorces, par 
exemple par Electrophordse sur gel ou au moyen d'une sonde 
30 oligonucl6otidique marquee selon la revendication 39. 

65, Kit pour la d6tection de la presence d'une bact€rie du 
complexe Mycobacterium tuberculosis dans un echantillon 

biologique, caracteris€ en ce qu'il comprend les Elements 
35 suivants : 
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a) une sonde oligonucl6otidique selon I'une des 
revendications 38 S 42 ; 

b) les reactifs n£cessaires £ la mise en oeuvre d'une 
reaction d' hybridation ; 

5 c) le cas 6ch6ant, un couple d' amorces selon l*une des 
revendications 35 a 37 ainsi que les reactifs n6cessaires 
a une reaction d' amplification de I'ADN (ADN g6nomique, 
plasmidique ou ADNc) d'une bacterie du complexe 
Mycobacterium tuberculosis . 

K) 

66. Kit ou necessaire pour la detection de la presence 
d f une bacterie du complexe Mycobacterium tuberculosis dans 

un echantillon biologique, caract£ris6 en ce qu'il comprend 
les elements suivants : 
15 a) une sonde oligonucl6otidique, dite sonde de capture, 
selon la revendication 4 0 ; 

b) une sonde oligonucl€otidique, dite sonde de rSvfelation, 
selon l l une des revendications 38 & 42 ; 

c> le cas ech6ant, un couple d* amorces selon l'une des 
20 revendications 35 a 37 ainsi que les reactifs nficessaires 
a une reaction d* amplification de 1 'ADN d'une bacterie du 
complexe Mycobacterium tuberculosis. 

67. Kit pour 1 1 amplification de 1' ADN d'une bacterie du 
25 complexe Mycobacterium tuberculosis present dans un 

Echantillon biologique, caract6ris6 en ce qu'il comprend 
les 616ments suivants : 

a) un couple d 1 amorces selon l'une des revendications 35 a 
37 ; 

30 b) leg rSactifs n£cessaires pour effectuer une reaction 
d 1 amplification d'ADN ; 

c) eventuellement un composant permettant de verifier la 
sequence du fragment amplifiS, plus particuli&rement une 
sonde oligonucleotidique selon l'une des revendications 38 

35 k 42. 
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68. Composition immunogdne caract6ris6e en ce qu'elle 
comprend un ou plusieurs polypeptides selon l'une des 
revendications 26, 32, 33 et 4 7 et/ou un ou plusieurs 
polypeptides hybrides selon l'une des revendications 48, 49 

5 et 51. 

69. Vaccin caract6ris6 en ce qu'il contient un ou plusieurs 
polypeptides selon l'une des revendications 26, 32, 33 et 
47 et/ou un ou plusieurs polypeptides hybrides selon l'une 

10 des revendications 48, 49 et 51, en association avec un 
vehicule pharmaceutiquement compatible et, le cas ech6ant 
un ou plusieurs adjuvants de l'immunite approprifis. 

70. Vaccin destine a 1 1 immunisation & 1 ■ encontre d'une 
15 infection bact6rienne ou virale, telle que la tuberculose 

ou l»h6patite, comprenant un vecteur selon la revendication 
43 ou un polynucleotide selon la revendication 50, en 
association avec un v6hicule pharmaceutiquement acceptable. 

20 71. Vaccin caractSrise en ce qu'il contient une ou 
plusieurs sequences nucleotidiques selon l'une des 
revendications 20 a 24 et/ou un ou plusieurs 
polynucleotides selon la revendication 25 en association 
avec un vihicule pharmaceutiquement compatible et, le cas 

25 €ch€ant, un ou plusieurs adjuvants de l'immunite 
appropri6s. 

72. M£thode de criblage de molecules capables d'inhiber 
la croissance de mycobacterias ou le maintien de 
30 mycobactSries dans un hdte, caract§risee en ce que lesdites 
molecules bloquent la synthese ou la fonction des 
polypeptides codes par une sequence nuclSotidique selon 
l'une quelconque des revendications 20 a 24 ou par un 
polynucleotide selon la revendication 25. 
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73. Methode de criblage selon la revendication 72, 
caracterisee en ce que les molecules sont des anti- 
messagers ou induisent la synthase d' anti-messagers . 

74. Molecules capables d'inhiber la croissance de 
mycobacteries ou le maintien de mycobacteries dans un hote, 
caracterisees en ce que lesdites molecules sont 
synthetisees d'apres la structure des polypeptides codes 
par une sequence nucleotidique selon l'une quelconque des 
revendications 20 a 24 ou par un polynucleotide selon 

la revendication 25. 
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1 GGATCCCAGGGAACGTGACC ATG GTC GTA GGG ATG ACT TGA CAGTTTCAACGGGGTGCGACCACCGTTGCGC 72 



1 








M 


V 


V 


G M 


T 




















7 


73 TC^\jGAAGGCATACGTTGGTGGAACACGTCGGAAAGCTGGGAGGTGAATCTG 
1 


ATG 
M 


GCT 
A 


GGC 
G 


GAC 
D 


CAA 
Q 


GAG 
E 


CTG 
L 


144 
7 


145 GAA 
8 E 


CTG 

It 


CGG 
R 


TTC 
P 


GAG GTT 
D V 


CCT 

P 


CTT 
L 


TAC ACG 
Y T 


CTT 
L 


GCC 
A 


GAG 
E 


GCA 
A 


TCG 
S 


CGG 
R 


TAC 
Y 


CTG 
L 


GTG 
V 


GTT 
V 


204 
27 


205 CCC 
28 P 


CGC 
R 


GCC 
A 


ACC 
T 


CTG GCT 
L A 


ACG 
T 


TGG 
W 


GCT GAC 
A D 


GGC 
G 


TAC 
Y 


GAG 
E 


CGT 
R 


CGG 
R 


CCG 
P 


GCC 
A 


AAC 
N 


GCA 
A 


CCG 
P 


264 
47 


265 GCG 
48 A 


GTC 
V 


CAG 
Q 


GGG 
G 


CAA CCG 
Q P 


ATC 
I 


GCC 
A 


TTT GAC 
F D 


GCC 
A 


TAT 
Y 


TCG 
S 


GTC 
V 


GCG 
A 


CAG 
Q 


CTT 
L 


TTT 
F 


GGC 
G 


GAC 
D 


324 
67 


325 GTC 
68 V 


ACT 
T 


GGT 
G 


GCC 
A 


CGC GTT 
R V 


GCG 
A 


GGC 
G 


GTC CAG 
V 0 


CCG 
P 


CAG 
Q 


CGA 

R 


CAC 
H 


CAC 
H 


ATA 
I 


CGG 
R 


CCG 
P 


GTC 
V 


CGG 
R 


384 
87 


385 TTG 
88 h 


CGG 
R 


GGG 
G 


CCG 
P 


TTG GGT 
L G 


GGG 
G 


GTT 
V 


GGG TGC 
G C 


CTC 
L 


CGT 
R 


CAC 
H 


CCC 
P 


AGG 
R 


CAG 
Q 


TTC 
F 


GCT 
A 


GGC 
G 


TAT 
Y 


444 

107 



445 TTG TCG CAG TAG CGCGACGGCATTGTCG ATG TCT TGG TAG CTAGCATCCGGTCGGGGCGCCGCTACCAGCG 515 
108 L S Q * M S W * 4 

516 CCAGCGCCGGGGCTCCCCGGTCCGGGTAGTGCGCGTCGAGTTGGTCGTGGACCAGCA ATG ACT GCG ACC CGG 587 
1 M T A T R 5 

588 CGA CTT CGA AAC CGC CAC CGG TTA GAT TCC CCG ACT GCG TCA TCG CCA GGT AAA CCG CCG 647 
6 R L R NRHRLDSP TAS5PGKPP 25 

648 GCA CTA ACG CCA GCA ACC AAC CCG TGA AGACCAACCAACGGCACCTGCGCAGGTTGCGGCTCAACCGCATC 718 
26ALTPATNP* 34 

719 ATG AAC TGC TGG ATT TCG GAC TCC CCG TAC TCT CGC GCA GTG CGT GCC CGC GAG CCT ACC 778 
1M NCWI SDSP-YSR AVRAREPT 20 

779 GAA GAT CGC GTG CAT GCG TTC GGC GTG GAC CGC ACA GCA CCT GGA GTT GGC GGC GCC GAG 833 
21ED RVHAFG VDRTAPGVGGAE 40 

839 GGC CGA GAT GGC AGG ATG ACG GAT CGT CGG GGG CGG GAA CTC CCA GGC CGC CGG ACC GTC 898 
41GRDGRMT DRRGRELPGRRTV 60 

899 GCA AAC CCG TCG CAA ACC CGT CGC AAA CCG TAA GGAGTCATCC ATG AAG ACA GGC ACC GCG 959 
61ANPSQTRRKP* MKTGTA 6 

960 ACG ACG CGG CGC AGG CTG TTG GCA GTA CTG ATC GCC CTC GCG TTG CCG GGG GCC GCC GTT 1019 
7T T R R R L h A V L I A LALPGAAV26 

1020 GCG CTG CTG GCC GAA CCA TCA GCG ACC GGC GCG TCG GAC CCG TGC GCG GCC AGC GAA GTG 1079 
27ALLAEP 5 AT G A S D P C AAS E V 46 

1080 GCG AGG ACG GTC GGT TCG GTC GCC AAG TCG ATG GGC GAC TAC CTG GAT TCA CAC CCA GAG 1139 
47 ARTVG5VAKSMGDYLDSHPE 66 

1140 ACC AAC CAG GTG ATG ACC GCG GTC TTG CAG CAG CAG GTA GGG CCG GGG TCG GTC GCA TCG 1199 
67TNQVMTAVLQQQVGPGSVAS36 

1200 CTG AAG GCC CAT TTC GAG GCG AAT CCC AAG GTC GCA TCG GAT CC 1243 
87 I* K A H F E AN P KVAS C 100 
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Insert du clone contenant DP428 et contenu dans seql 
1/1 31/11 

GAT CGC CTT TGA CGC CTA TTC GGT CGC GCA GCT TTT TGG CGA CGT CAC TGG TGC CCG CGT 
asp arg leu OPA arg leu phe gly arg ala ala phe trp arg arg his trp cys pro arg 
61/21 91/31 

TGC GGG CGT CCA GCC GCA GCG ACA CCA CAT ACG GCC GGT CCG GTT GCG GGG GCC GTT GGG 
cys gly arg pro ala ala ala thr pro his thr ala gly pro val ala gly ala val gly 
121/41 151/51 

TGG GGT TGG GTG CCT CCG TCA CCC CAG GCA GTT CGC TGG CTA TTT GTC GCA GTA GCG CGA 
trp gly trp val pro pro ser pro gin ala val arg trp leu phe val ala val ala arg 
181/61 211/71 

CGG CAT TGT CGA TGT CTT GGT AGC TAG CAT CCG GTC GGG GGG CCG CTA CCA GCG CCA GCG 
arg his cys arg cys leu gly ser AMB his pro val gly gly pro leu pro ala pro ala 
241/81 271/91 

CCG GGG CTC CCC GGT CCG GGT AGT GCG CGT CGA GTT GGT CGT GGA CCA GCA ATG ACT GCG 
pro gly leu pro gly pro gly 3er ala arg arg val gly arg gly pro ala met thr ala 
301/101 331/111 

ACC CGG CGA CTT CGA AAC CGC CAC CGG TTA GAT TCC CCG ACT GCG TCA TCG CCA GGT AAA 
thr arg arg leu arg asn arg his arg leu asp ser pro thr ala ser ser pro gly lys 
361/121 391/131 

CCG CCG GCA CTA ACG CCA GCA ACC AAC CCG TGA AGA CCA ACC AAC GGC ACC TGC GCA GGT 
pro pro ala leu thr pro ala thr asn pro OPA arg pro thr asn gly thr cys ala gly 
421/141 451/151 

TGC GGC TCA ACC GCA TCA TGA ACT GCT GGA TTT CGG ACT CCC CGT ACT CTC GCG CAG TGC 
cy3 gly ser thr ala ser OPA thr ala gly phe arg thr pro arg thr leu ala gin cys 
481/161 511/171 

GTG CCC GCG AGC CTA CCG AAG ATC GCG TGC ATG CGT TCG GCG TGG ACC GCA CAG CAC CTG 
val pro ala ser leu pro lys ile ala cys met arg ser ala trp thr ala gin his leu 
541/181 571/191 

GAG TTG GCG GCG CCG AGG GCC GAG ATG GCA GGA TGA CGG ATC GTC GGG GGC GGG AAC TCC 
glu leu ala ala pro arg ala glu met ala gly OPA arg ile val gly gly gly asn ser 
601/201 631/211 

CAG GCC GCC GGA CCG TCG CAA ACC CGT CGC AAA CCC GTC GCA AAC CGT AAG GAG TCA TCC 
gin ala ala gly pro ser gin thr arg arg lys pro val ala asn arg lys glu ser ser 
661/221 691/231 

ATG AAG ACA GGC ACC GCG ACG ACG CGG CGC AGG CTG TTG GCA GTA CTG ATC GCC CTC GCG 
met lys thr gly thr ala thr thr arg arg arg leu leu ala val leu ile ala leu ala 
721/241 751/251 

TTG CCG GGG GCC GCC GTT GCG CTG CTG GCC GAA CCA TCA GCG ACC GGC GCG TCG GAC CCG 
leu pro gly ala ala val ala leu leu ala glu pro ser ala thr gly ala ser asp pro 
781/261 811/271 

TGC GCG GCC AGC GAA GTG GCG AGG ACG GTC GGT TCG GTC GCC AAG TCG ATG GGC GAC TAG 
cy3 ala ala ser glu val ala arg thr val gly ser val ala lys ser met gly asp tyr 
841/281 871/291 

CTG GAT TCA CAC CCA GAG ACC AAC CAG GTG ATG ACC GCG GTC TTG CAG CAG CAG GTA GGG 
leu asp ser his pro glu thr asn gin val met thr ala val leu gin gin gin val gly 
901/301 931/311 

CCG GGG TCG GTC GCA TCG CTG AAG GCC CAT TTC GAG GCG AAT CCC AAG GTC GCA TCG GAT 
pro gly ser val ala ser leu lys ala his phe glu ala asn pro lys val ala ser asp 
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Insert du clone contenant DP428, autre phase de lecture 
2/1 32/11 

ATC GCC TTT GAC GCC TAT TCG GTC GCG CAG CTT TTT GGC GAC GTC ACT GGT GCC CGC GTT 
tie ala phe asp ala tyr ser val ala gin leu phe gly asp val thr gly ala arg val 
62/21 92/31 

GCG GGC GTC CAG CCG CAG CGA CAC CAC ATA CGG CCG GTC CGG TTG CGG GGG CCG TTG GGT 
ala gly val gin pro gin arg his his lie arg pro val arg leu arg gly pro leu gly 
122/41 152/51 

GGG GTT GGG TGC CTC CGT CAC CCC AGG CAG TTC GCT GGC TAT TTG TCG CAG TAG CGC GAC 
gly val gly cys leu arg his pro arg gin phe ala gly tyr leu ser gin AMB arg asp 
182/61 212/71 

GGC ATT GTC GAT GTC TTG GTA GCT AGC ATC CGG TCG GGG GGC CGC TAG CAG CGC CAG CGC 
gly ile val asp val leu val ala ser ile arg ser gly gly arg tyr gin arg gin arg 
242/81 272/91 

CGG GGC TCC CCG GTC CGG GTA GTG CGC GTC GAG TTG GTC GTG GAC CAG CAA TGA CTG CGA 
arg gly ser pro val arg val val arg val glu leu val val asp gin gin OPA leu arg 
302/101 332/111 

CCC GGC GAC TTC GAA ACC GCC ACC GGT TAG ATT CCC CGA CTG CGT CAT CGC CAG GTA AAC 
pro gly asp phe glu thr ala thr gly AMB ile pro arg leu arg his arg gin val asn 
362/121 392/131 

CGC CGG CAC TAA CGC CAG CAA CCA ACC CGT GAA GAC CAA CCA ACG GCA CCT GCG CAG GTT 
arg arg his OCH arg gin gin pro thr arg glu asp gin pro thr ala pro ala gin val 
422/141 452/151 

GCG GCT CAA CCG CAT CAT GAA CTG CTG GAT TTC GGA CTC CCC GTA CTC TCG CGC AGT GCG 
ala ala gin pro his his glu leu leu asp phe gly leu pro val leu ser arg ser ala 
482/161 512/171 

TGC CCG CGA GCC TAC CGA AGA TCG CGT GCA TGC GTT CGG CGT GGA CCG CAC AGC ACC TGG 
cys pro arg ala tyr arg arg ser arg ala cys val arg arg gly pro his ser thr trp 
542/181 572/191 

AGT TGG CGG CGC CGA GGG CCG AGA TGG CAG GAT GAC GGA TCG TCG GGG GCG GGA ACT CCC 
ser trp arg arg arg gly pro arg trp gin asp asp gly ser ser gly ala gly thr pro 
602/201 • 632/211 

AGG CCG CCG GAC CGT CGC AAA CCC GTC GCA AAC CCG TCG CAA ACC GTA AGG AGT CAT CCA 
arg pro pro asp arg arg lys pro val ala asn pro ser . gin thr val arg ser his pro 
662/221 692/231 

TGA AGA CAG GCA CCG CGA CGA CGC GGC GCA GGC TGT TGG CAG TAC TGA TCG CCC TCG CGT 
OPA arg gin ala pro arg arg arg gly ala gly cys trp gin tyr OPA ser pro ser arg 
722/241 752/251 

TGC CGG GGG CCG CCG TTG CGC TGC TGG CCG AAC CAT CAG CGA CCG GCG CGT CGG ACC CGT 
cys arg gly pro pro leu arg cys trp pro asn his gin arg pro ala arg arg thr arg 
782/261 " ' 812/271 

GCG CGG CCA GCG AAG TGG CGA GGA CGG TCG GTT CGG TCG CCA AGT CGA TGG GCG ACT ACC 
ala arg pro ala lys trp arg gly arg ser val arg ser pro ser arg trp ala thr thr 
842/281 872/291 

TGG ATT CAC ACC CAG AGA CCA ACC AGG TGA TGA CCG CGG TCT TGC AGC AGC AGG TAG GGC 
trp ile his thr gin arg pro thr arg OPA OPA pro arg ser cys sq£ ser arg AMB gly 
902/301 932/311 

CGG GGT CGG TCG CAT CGC TGA AGG CCC ATT TCG AGG CGA ATC CCA AGG TCG CAT CGG ATC 
arg gly arg ser his arg OPA arg pro ile ser arg arg ile pro arg ser his arg ile 
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SeqlC: Insert du clone DP428, autre phase de lecture 
3/1 33/11 

TCG CCT TTG ACG CCT ATT CGG TCG CGC AGC TTT TTG GCG ACG TCA CTG GTG CCC GCG TTG 
ser pro leu thr pro ile arg ser arg ser phe leu ala thr ser leu val pro ala leu 
63/21 93/31 

CGG GCG TCC AGC CGC AGC GAC ACC ACA TAC GGC CGG TCC GGT TGC GGG GGC CGT TGG GTG 
arg ala ser ser arg ser asp thr thr tyr gly arg ser gly cys gly gly arg trp val 
123/41 153/51 

GGG TTG GGT GCC TCC GTC ACC CCA GGC AGT TCG CTG GCT ATT TCT CGC AGT AGC GCG ACG 
gly leu gly ala ser val thr pro gly ser ser leu ala ile cys arg ser ser ala thr 
183/61 213/71 

GCA TTG TCG ATG TCT TGG TAG CTA GCA TCC GGT CGG GGG GCC GCT ACC AGC GCC AGC GCC 
ala leu ser met ser trp AMB leu ala ser gly arg gly ala ala thr ser ala ser ala 
243/81 273/91 

GGG GCT CCC CGG TCC GGG TAG TGC GCG TCG AGT TGG TCG TGG ACC AGC AAT GAC TGC GAC 
gly ala pro arg ser gly AMB cys ala ser ser trp ser trp thr ser asn asp cys asp 
303/101 * 333/111 

CCG GCG ACT TCG AAA CCG CCA CCG GTT AGA TTC CCC GAC TGC GTC ATC GCC AGG TAA ACC 
pro ala thr ser lys pro pro pro val arg phe pro asp cys val ile ala arg OCH thr 
363/121 393/131 

GCC GGC ACT AAC GCC AGC AAC CAA CCC GTG AAG ACC AAC CAA CGG CAC CTG CGC AGG TTG 
ala gly thr asn ala ser asn gin pro val lys thr asn gin arg his leu arg arg leu 
423/141 453/151 

CGG CTC AAC CGC ATC ATG AAC TGC TGG ATT TCG GAC TCC CCG TAC TCT CGC GCA GTG CGT 
arg leu asn arg ile met asn cys trp ile ser asp ser pro tyr ser arg ala val arg 
483/161 ~ 513/171 

GCC CGC GAG CCT ACC GAA GAT CGC GTG CAT GCG TTC GGC GTG GAC CGC ACA GCA CCT GGA 
ala arg glu pro thr glu asp arg val his ala phe gly val asp arg thr ala pro gly 
543/181 ^ 573/191 

GTT GGC GGC GCC GAG GGC CGA GAT GGC AGG ATG ACG GAT CGT CGG GGG CGG GAA CTC CCA 
val gly gly ala glu gly arg asp gly arg met thr asp arg arg gly arg glu leu pro 
603/201 633/211 

GGC CGC CGG ACC GTC GCA AAC CCG TCG CAA ACC CGT CGC AAA CCG TAA GGA GTC ATC CAT 
gly arg arg thr val ala asn pro ser gin thr arg arg lys pro OCH gly val ile his 
663/221 693/231 

GAA GAC AGG CAC CGC GAC GAC GCG GCG CAG GCT GTT GGC AGT ACT GAT CGC CCT CGC GTT 
glu asp arg his arg asp asp ala ala gin ala val gly ser thr asp arg pro arg val 
723/241 753/251 

GCC GGG GGC CGC CGT TGC GCT GCT GGC CGA ACC ATC AGC GAC CGG CGC GTC GGA CCC GTG 
ala gly gly arg arg cys ala ala gly arg thr ile ser asp arg arg val gly pro val 
783/261 813/271 

CGC GGC CAG CGA AGT GGC GAG GAC GGT CGG TTC GGT CGC CAA GTC GAT GGG CGA CTA CCT 
arg gly gin arg ser gly glu asp gly arg phe gly arg gin val asp gly arg leu pro 
. 843/281 873/291 

GGA TTC ACA CCC AGA GAC CAA CCA GGT GAT GAC CGC GGT CTT GCA GCA GCA GGT AGG GCC 
gly phe thr pro arg asp gin pro gly asp asp arg gly leu ala ala ala gly arg ala 
903/301 933/311 

GGG GTC GGT CGC ATC GCT GAA GGC CCA TTT CGA GGC GAA TCC CAA GGT CGC ATC GGA TC 
gly val gly arg ile ala glu gly pro phe arg gly glu ser gin gly arg ile gly 
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Sequence codante DP428 identique a la s6quence Rv0203 predite par Cole et al 
(Nature 393:537-544) 

1/1 31/11 



ATG AAG 


ACA 


GGC 


ACC 


GCG 


ACG 


ACG 


CGG 


CGC 


AGG CTG 


TTG 


GCA 


GTA CTG ATC 


GCC 


CTC 


GCG 


Met lys 


thr 


gly 


thr 


ala 


thr 


thr 


arg 


arg 


arg leu 


leu 


ala 


val leu ile 


ala 


leu 


ala 


61/21 


















91/31 










TTG CCG 


GGG 


GCC 


GCC 


GTT 


GCG 


CTG 


CTG 


GCC 


GAA CCA 


TCA 


GCG 


ACC GGC GCG 


TCG 


GAC 


CCG 


leu pro 


gly 


ala 


ala 


val 


ala 


leu 


leu 


ala 


glu pro 


ser 


ala 


thr gly ala 


ser 


asp 


pro 


121/41 


















151/51 








TGC GCG 


GCC 


AGC 


GAA 


GTG 


GCG 


AGG 


ACG 


GTC 


GGT TCG 


GTC 


GCC 


AAG TCG ATG 


GGC 


GAC 


TAC 


cys ala 


ala 


ser 


glu 


val 


ala 


arg 


thr 


val 


gly ser 


val 


ala 


lys ser met 


gly 


asp 


tyr 


181/61 


















211/71 








CTG GAT 


TCA 


CAC 


CCA 


GAG 


ACC 


AAC 


CAG 


GTG 


ATG ACC 


GCG 


GTC 


TTG CAG CAG 


CAG 


GTA 


GGG 


leu asp 


ser 


his 


pro 


glu 


thr 


asn gin 


val 


met thr 


ala 


val 


leu gin gin 


gin val alv 


241/81 


















271/91 












CCG GGG 


TCG 


GTC 


GCA 


TCG 


CTG 


AAG 


GCC 


CAT 


TTC GAG 


GCG 


AAT 


CCC AAG GTC 


GCA TCG 


GAT 


pro gly 


ser 


val 


ala 


ser 


leu 


lys ala 


his 


phe glu 


ala 


asn 


pro lys val 


ala 


ser 


asp 


301/101 


















331/111 










CTG CAC 


GCG 


CTT 


TCG 


CAA 


CCG 


CTG 


ACC 


GAT 


CTT TCG 


ACT 


CGG 


TGC TCG CTG 


CCG 


ATC 


AGC 


leu his 


ala 


leu 


ser 


gin 


pro 


leu 


thr 


asp 


leu ser 


thr 


arg 


cys ser leu 


pro 


ile 


ser 


361/121 


















391/131 












GGG CTG 


CAG 


GCG 


ATC 


GGT 


TTG 


ATG 


CAG 


GCG 


GTG CAG 


GGC 


GCC 


CGC CGG TAG 








gly leu 


gin 


ala 


ile 


gly 


leu 


met 


gin 


ala 


val gin 


gly 


ala 


arg arg AMB 
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1/1 


















31/11 


















TGA CGG 


ATC 


GTC 


GGG 


GGC 


GGG 


AAC 


TCC 


CAG 


GCC GCC 


GGA 


CCG 


TCG 


CAA ACC 


CGT 


CGC 


AAA 


OPA arg 


ile 


val 


gly 


gly 


gly 


asn 


ser 


gin 


ala ala 


gly 


pro 


ser 


gin 


thr 


arg 


arg 


lys 


61/21 . 


















91/31 












CCC GTC 


GCA 


AAC 


CGT 


AAG 


GAG 


TCA 


TCC 


ATG 


AAG ACA 


GGC 


ACC 


GCG 


ACG 


ACG 


CGG 


CGC 


AGG 


pro val 


ala 


asn 


arg 


lys 


glu 


ser 


ser 


met 


lys thr 


gly 


thr 


ala 


thr 


thr 


arg 


arg 


arg 


121/41 


















151/51 












CTG TTG 


GCA 


GTA 


CTG 


ATC 


GCC 


CTC 


GCG 


TTG 


CCG GGG 


GCC 


GCC 


GTT 


GCG 


CTG 


CTG 


GCC 


GAA 


leu leu 


ala 


val 


leu 


ile 


ala 


leu 


ala 


leu 


pro gly ala 


ala 


val 


ala 


leu 


leu 


ala 


glu 


181/61 


















211/71 
















CCA TCA 


GCG 


ACC 


GGC 


GCG 


TCG 


GAC 


CCG 


TGC 


GCG GCC 


AGC 


GAA 


GTG 


GCG 


AGG 


ACG 


GTC 


GGT 


pro ser 


ala 


thr 


gly 


ala 


ser 


asp 


pro 


cys 


ala ala 


ser 


glu 


val 


ala 


arg 


thr 


val 




241/81 


















271/91 
















TCG GTC 


GCC 


AAG 


TCG 


ATG 


GGC 


GAC 


TAC 


CTG 


GAT TCA 


CAC 


CCA 


GAG 


ACC 


AAC 


CAG 


GTG 


ATG 


ser val 


ala 


lys 


ser 


met 


gly asp tyr 


leu 


asp ser 


his 


pro 


glu 


thr 


asn 


gin val 


met 


301/101 


















331/111 


















ACC GCG 


GTC 


TTG 


CAG 


CAG 


CAG 


GTA 


GGG 


CCG 


GGG TCG 


GTC 


GCA 


TCG 


CTG 


AAG 


GCC 


CAT 


TTC 


thr ala 


val 


leu gin 


gin 


gin 


val 


gly 


pro 


gly ser 


val 


ala 


ser 


leu lys 


ala 


his 


phe 


361/121 


















391/131 
















GAG GCG 


AAT 


CCC 


AAG 


GTC 


GCA 


TCG 


GAT 


CTG 


CAC GCG 


CTT 


TCG 


CAA 


CCG 


CTG 


ACC 


GAT 


CTT 


glu ala 


asn 


pro 


lys 


val 


ala 


ser 


asp 


leu 


his ala 


leu 


sec 


gin 


pro 


leu 


thr 


asp 


leu 


421/141 


















451/151 
















TCG ACT 


CGG 


TGC 


TCG 


CTG 


CCG 


ATC 


AGC 


GGC 


CTG CAG 


GCG 


ATC 


GGT 


TTG 


ATG 


CAG 


GCG 


GTG 


ser thr 


arg 


cys 


ser 


leu 


pro 


ile 


ser 


gly 


leu gin 


ala 


ile 


gly 


leu 


met 


gin 


ala 


val 


481/161 




































CAG GGC 


GCC 


CGC 


CGG 


TAG 




























gin gly 


ala 


arg 


arg 


AMB 





























SEQ ID N° IF 



FEUILLE DE REMF^giftEfc? (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



6/185 



491 CCGGTCGGGGGGCCGCTACCAGCGCCAGCGCCGGGGCTCCCCGGTCCGGGTA GTG CGC GTC GAG TTG GTC GTG 563 
1 VRVELVV7 



564 GAC CAG CAA TGA CTGCGACCO 
8 D Q Q 



GGCp 



;acttcgaaaccgccaccggttagattccccgactgcgtcat< 



CC^CAGGT, 



AA 639 



640 ACCGCCGGCACTAACGCCAGCAACCAACCC GTG AAG ACC AAC CAA CGG CAC CTG CGC AGG TTG CGG 705 
1 V KTNQRHI.RRLR12 



706 CTC 
13 L 


AAC 
N 


CGC 
R 


ATC 
I 


ATG 
M 


AAC 
N 


TGC 

C 


TGG 
W 


ATT 
I 


TCG 
S 


GAC 
D 


TCC 
S 


CCG 
P 


TAC TCT CGC GCA GTG CGT GCC 
Y S R A V R A 


765 
32 


766 CGC 
33 R 


GAG 
E 


CCT 
P 


ACC 
T 


GAA 

E 


GAT 
D 


CGC 
R 


GTG 
V 


CAT 
H 


GCG 
A 


TTC 
F 


GGC 
G 


GTG 
V 


GAC CGC ACA GCA CCT GGA GTT 
D R T A P G V 


825 
52 


826 GGC 
53 G 


GGC 
G 


GCC 
A 


GAG 
E 


GGC 
G 


CGA 
R 


GAT 
0 


GGC 
G 


AGG 
R 


ATG 
M 


ACG 
T 


GAT 
D 


CGT 
R 


CGG GGG CGG GAA CTC CCA GGC 
R f G R £ L P G 


885 
72 


886 CGC 
73 R 


CGG 
R 


ACC 
T 


GTC 
V 


GCA 
A 


AAC 
N 


CCG 
P 


TCG 
S 


CAA 
Q 


ACC 
T 


CGT 
R 


CGC 
R 


AAA 
K 


CCG TAA GGAGTCATCC ATG AAG 
P * xitxxxx M K 


946 

2 


947 ACA 
3 T 


GGC 
G 


ACC 

T 


GCG 
A 


ACG 
T 


ACG 
T 


CGG 
R 


CGC 
R 


AGG 
R 


CTG 
L 


TTG 
L 


GCA 
A 


GTA 
V 


CTG ATC GCC CTC GCG TTG CCG 
L I A L A L P 


1006 

22 



1007 GGG 
23 G 



GCC GCC 
A A 



GTT GC<P 
V A 



CTG CTG GCC GAA CCA 
L L A E P 



TCA GCG 
S A 



ACC GGC GCG TCG GAC CCG TGC GCG 
TGASDPCA 



1066 
42 



1126 
62 



1067 GCC 
43 A 



AGC GAA 
S E 



GTG GC€ 
V A 



AGG ACG GTC GGT TCG 
R T V G S 



GTC GCC 
V A 



AAG TCG ATG GGC GAC TAC CTG GAT 
K S M G D V L D 



1127 TCA 
63 S 



CAC CCA 
H P 



GAG ACC 
E T 



AAC CAG GTG ATG ACC 
N Q V M T 



GCG GTC 
A V 



TTG CAG CAG CAG GTA GGG CCG GGG 
LQQQVGPG 



1196 
82 



1187 TCG 
93 S 



GTC GCA 
V A 



TCG CTG 
S L 



AAG GCC CAT TTC GAG 
K A H F E 



GCG- AAT 
A N 



CCC AAG GTC GCA TCG GAT CTG CAC 
P K V A S D L H 



1246 
102 



1247 GCG 
103 A 



CTT TCG 

L S 



CAA CCG 
Q P 



CTG ACC GAT CTT TCG 
L T D L S 



ACT CGG 

T a 



TGC TCG CTG CCG A TC AGC GGC CTG 
C S | L P I 



13C6 
122 

1366 
5 



1307 CAG 
123 Q 



GCG ATC 
A I 



GGT TTG 
G L 



ATG CAG GCG GTG CAG 
M Q A V Q 



GGC GCC 

G A 



CGC CGG TAG ATG CCG GAC CGC CGC 
R Rl * M P D R R 



i 3 57 CGG 
6 R 



GTC CGG 
V R 



CGC AGT 
R S 



CGA CGT GAG GCA GCG 
R R E A A 



GTC GCC 
V A 



TAC CGG GGC GGT GTC TCG CCG CCT 
YRGGVSPp 



1425 
25 



1427 TCT 
26 5 



GGT CGC 
G R 



AGG TCA 
R S 



GGG GTC GGC GCT GGA 
G V G A G 



CCT TGC 
£» C 



GGT GTG GTT TCG ACC GGG TCG TCG 
GV VSTGSS 



1486 
45 



1437 CAG 
46 Q 



GGT GTG 
G V 



CCC TGC 
P C 



GGT TGG ATG ACA AGT 
G W M T S 



CGC AGG 
R R 



TTT GGA TCG GTT GGC GGG TCG CGA 
FGSVGGSR 



1546 
65 



15-57 TCG TTG T 
65 3 L 



1553 
67 



SEQ ID N° 2 
FIGURE 2 



FEUILLE DE RENIPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



7/185 



TCG CCG GCT CGC GGA CGT AGA 
ser pro ala arg gly arg arg 
61/21 

TGA CTG CCG GGC TTG ACG CGG 
OPA leu pro gly leu thr arg 
121/41 

TGA CCT GGG GTG CGT GGG CGC 
OPA pro gly val arg gly arg 
181/61 

CTC GGT CGC CGG CAG TGT CAG 
leu qly arq arq qln cys gin 
241/81 

TCG TGG TTG CGA CGA CTT GGC 

ser trp leu arg arg leu gly 

301/101 

GAT C 

asp 







31/11 




TAA TAG 


CTC 


ACC GTT 


GGA 


OCH AMB 


leu 


thr val gly 






91/31 




ACG ACC 


ACA 


GAG TCG 


GGT 


thr thr 


thr 


glu ser gly 






151/51 




CGA CGA 


GTG 


AGG CAG 


TCA 


arg arg 


val 


arg gin 


ser 






211/71 




CAT GTG 


CAG 


ATG ACT 


CCA 


his val 


gin 


met thr 


pro 






271/91 




GCT GGT 


GAG 


CGC ACC 


CGC 


ala gly 


glu 


arg thr 


arg 



SEQ ID N° 3A 
FIGURE 3A 



CGA CCT CGA CAG GGT CCT TTG 
arg pro arg gin gly pro leu 

CAT CGC CTA AGG CTA CCG TTC 
his arg leu arg leu pro phe 

TGT CTC AGG GCC CAC CGC CAC 
cys leu arg ala his arg his 

CGC AGC TTG TTC GTG TTG GTG 
arg ser leu phe val leu val 

CGG CGT CGT GCC GCG CAT GCG 
arg arg arg ala ala his ala 



CGC CGG CTC GCG 
arg arg leu ala 
62/21 

GAC TGC CGG GCT 
asp cys arg ala 
122/41 

GAC CTG GGG TGC 
asp leu gly cys 
182/61 

TCG GTC GCC GGC 
ser val ala gly 
242/81 

CGT GGT TGC GAC 

arg gly cys asp 

302/101 

ATC 

ile 



GAC GTA GAT AAT 
asp val asp asn 

TGA CGC GGA CGA 
OPA arg gly arg 

GTG GGC GCC GAC 
val gly ala asp 

AGT GTC AGC ATG 
ser val ser met 

GAC TTG GCG CTG 
asp leu ala leu 







32/11 


AGC 


TCA 


CCG TTG 


ser 


ser 


pro leu 






92/31 


CCA 


CAG 


AGT CGG 


pro 


gin 


ser arg 






152/51 


GAG 


TGA 


GGC AGT 


glu 


OPA 


gly ser 






212/71 


TGC 


AGA 


TGA CTC 


cys 


arg 


OPA leu 






272/91 


GTG 


AGC 


GCA CCC 


val 


ser 


ala pro 



SEQ ID N° 3B 
FIGURE 3B 



GAC GAC CTC GAC 
asp asp leu asp 

GTC ATC GCC TAA 
val ile ala OCH 

CAT GTC TCA GGG 
his val ser gly 

CAC GCA GCT TGT 
his ala ala cys 

GCC GGC GTC GTG 
ala gly val val 



AGG GTC CTT TGT 
arg val leu cys 

GGC TAC CGT TCT 
gly tyr arg ser 

CCC ACC GCC ACC 
pro thr ala thr 

TCG TGT TGG TGT 
ser cys trp cys 

CCG CGC ATG CGG 
pro arg met arg 



FEUILLE DE REMPLAGEMENT (REGLE 26) 



WO 99/09186 



8/185 



PCT7FR98/01813 



33/11 

GCC GGC TCG CGG ACG TAG ATA ATA GCT CAC CGT TGG ACG ACC TCG ACA GGG TCC TTT GTG 
ala gly sec arg thr AMB ile ile ala his arg trp the the sec thr gly ser phe val 
63/21 93/31 

ACT GCC GGG CTT GAC GCG GAG GAC CAC AGA GTC GGG TCA TCG CCT AAG GCT ACC GTT CTG 
thr ala gly leu asp ala asp asp his arg val gly ser ser pro lys ala thr val leu 
123/41 153/51 

ACC TGG GGT GCG TGG GCG CCG ACG AGT GAG GCA GTC ATG TCT CAG GGC CCA CCG CCA CCT 
thr trp gly ala trp ala pro thr ser glu ala val met ser gin gly pro pro pro pro 
183/61 213/71 

CGG TCG CCG GCA GTG TCA GCA TGT GCA GAT GAC TCC ACG CAG CTT GTT CGT GTT GGT GTC 
arg ser pro ala val ser ala cys ala asp asp ser thr gin leu val arg val gly val 
243/81 273/91 

GTG GTT GCG ACG ACT TGG CGC TGG TGA GCG CAC CCG CCG GCG TCG TGC CGC GCA TGC GGA 
val val ala thr thr trp arg trp OPA ala his pro pro ala ser cys arg ala cys gly 

TC 



SEQ ID N 9 3C 
FIGURE 3C 



CCA ATT TTC CTT CGC GCC GTG 
pro ile phe leu arg ala val 
61/21 

GTC GCG CAG CTT GCG GAA ACC 
val ala gin leu ala glu thr 
121/41 

CGT CGC TCT CCA CCC GTC GGG 
arg arg ser pro pro val gly 
181/61 

GGC TGA GTG TCT GCA GGG CTC 
gly OPA val ser ala gly leu 
241/81 

GTC CCC CGC GCG CGA CTT CCA 
val pro arg ala arg leu pro 
301/101 

CAT TTC GCA GCA ACC GGT CTC 
his phe ala ala thr gly leu 
361/121 

CGG ACG AGT CGT CGT CAA CGA 
arg thr ser arg arg gin arg 



* 31/11 
CAA TAC CAT CTG CAA GAC 
gin tyr his leu gin asp 
91/31 

GGG TAT GGA CCC TGC CGT 
gly tyr gly pro cys arg 
151/51 

GGG CGA AAG CCA TTC CGA 
gly arg lys pro phe arg 

211/71 
CGG GGA GCA GCC GAT CAT 
arg gly ala ala asp his 

271/91 
GAC ATT TGT TGT GGT TTC 
asp ile cys cys gly phe 

331/111 
CGG GTC GCA GCA TCG TTG 
arg val ala ala ser leu 

CCA CGA TC 
pro atg 



SEQ ID N° 4A 
FIGURE 4A 



CAG CGA CGG CCC GTG GTT GCG 
gin arg arg pro val val ala 

ACC GTT GTT GCC ACT TGA TGT 
thr val val ala thr OPA cys 

CAC TGG GAT CCT CAA AAC GTC 
his trp asp pro gin asn val 

CAC CAT GTA CGA ACT GAA TAA 
his his val arg thr glu OCH 

GGT TGA GGC CGA GGC GAG GCT 
gly OPA gly arg gly glu ala 

CGG CGA TCG CGG CGC AGT CGT 
arg arg ser arg arg ser arg 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



9/185 



CAA TTT TCC TTC GCG CCG TGC 
gin phe ser phe ala pro cys 
62/21 

TCG CGC AGC TTG CGG AAA CCG 
ser arg ser leu arg lys pro 
122/41 

GTC GCT CTC CAC CCG TCG GGG 
val ala leu his pro ser gly 
182/61 

GCT GAG TGT CTG CAG GGC TCC 
ala glu cys leu gin gly ser 
242/81 

TCC CCC GCG CGC GAC TTC CAG 
ser pro ala arg asp phe gin 
302/101 

ATT TCG CAG CAA CCG GTC TCC 
ile ser gin gin pro val ser 
362/121 

GGA CGA GTC GTC GTC AAC GAC 
gly arg val val. val asn asp 







32/11 




AAT ACC 


ATC 


TGC AAG 


ACC 


asn thr 


ile 


cys lys 


thr 






92/31 




GGT ATG 


GAC 


CCT GCC 


GTA 


gly met 


asp 


pro ala 


val 






152/51 




GGC GAA 


AGC 


CAT TCC 


GAC 


gly giu 


ser 


his ser 


asp 






212/71 




GGG GAG 


CAG 


CCG ATC 


ATC 


gly glu 


gin 


pro ile 


ile 






272/91 




ACA TTT 


GTT 


GTG GTT 


TCG 


thr phe 


val 


val val 


ser 






332/111 




GGG TCG 


CAG 


CAT CGT 


TGC 


gly ser 


gin 


his arg 


cys 



CAC GAT C 
his asp 



SEQ ID N° 4B 
FIGURE 4B 



AGC GAC GGC CCG TGG TTG CGG 
ser asp gly pro trp leu arg 

CCG TTG TTG CCA CTT GAT GTC 
pro leu leu pro leu asp val 

ACT GGG ATC CTC AAA ACG TCG 
thr gly ile leu lys thr ser 

ACC ATG TAC GAA CTG AAT AAG 
thr met tyr glu leu asn lys 

GTT GAG GCC GAG GCG AGG CTC 
val glu ala glu ala arg leu 

GGC GAT CGC GGC GGA GTC GTC 
gly asp arg gly ala val val 



AAT TTT CCT TCG CGC CGT GCA ATA CCA TCT 
asn phe pro ser arg arg ala ile pro ser 
63/21 

CGC GCA GCT TGC GGA AAC CGG GTA TGG ACC 
arg ala ala cys gly asn arg val trp thr 
123/41 

TCG CTC TCC ACC CGT CGG GGG GCG AAA GCC 
ser leu ser thr arg arg gly ala lys ala 
183/61 

CTG AGT GTC TGC AGG GCT CCG GGG AGC AGC 
leu ser val cys arg ala pro gly ser ser 
243/81 

CCC CCG CGC GCG ACT TCC AGA CAT TTG TTG 
pro pro arg ala thr ser arg his leu leu 
303/101 

TTT CGC AGC AAC CGG TCT CCG GGT CGC AGC 
phe arg ser asn arg ser pro gly arg ser 
363/121 

GAC GAG TCG TCG TCA ACG ACC ACG ATC 
asp glu ser ser ser thr thr thr ile 



33/11 

GCA AGA CCA GCG ACG GCC CGT GGT TGC GGT 
ala arg pro ala thr ala arg gly cys gly 
93/31 

CTG CCG TAC CGT TGT TGC CAC TTG ATG TCG 
leu pro tyr arg cys cys his leu met ser 
153/51 

ATT CCG ACA CTG GGA TCC TCA AAA CGT CGG 
ile pro thr leu gly ser ser lys arg arg 
213/71 

CGA TCA TCA CCA TGT ACG AAC TGA ATA AGT 
arg ser ser pro cys thr asn OPA ile ser 
273/91 

TGG TTT CGG TTG AGG CCG AGG CGA GGC TCA 
trp phe arg leu arg pro arg arg gly ser 
333/111 

ATC GTT GCG GCG ATC GCG GCG CAG TCG TCG 
ile val ala ala ile ala ala gin ser ser 



SEQ ID N° 4C 



FEUILLE DE REMpS^SSifer^f (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



10/185 



partie de la sequence nucleotidique de seq4A 
1/1 31/11 

CCG CGC GCG ACT TCC AGA CAT TTG TTG TGG TTT CGG TTG AGG CCG AGG CGA GGC TCA TTT 

pro arg ala thr ser arg his leu leu trp phe arg leu arg pro arg arg gly, ser phe 
61/21 91/31 

CGC AGC AAG CGG TCT CCG GGT CGC AGC ATC GTT GCG GCG ATC GCG GCG CAG TCG TCG GAC 
arg ser lys arg ser pro gly arg ser ile val ala ala lie ala ala gin ser ser asp 
121/41 

GAG TCG TCG TCA ACG ACC ACG ATC 
glu ser ser ser thr thr thr ile 



SEQ ID N° 4A' 
FIGURE 4A' 



1/1 31/11 

CGC GCG CGA CTT CCA GAC ATT TGT TGT GGT TTC GGT TGA GGC CGA GGC GAG GCT CAT TTC 
arg ala arg leu pro asp ile cys cys gly phe gly OPA gly arg gly glu ala his phe 
61/21 91/31 

GCA GCA AGC GGT CTC CGG GTC GCA GCA TCG TTG CGG CGA TCG CGG CGC AGT CGT CGG ACG 
ala ala ser gly leu arg val ala ala ser leu arg arg ser arg arg ser arg arg thr 
121/41 

AGT CGT CGT CAA CGA CCA CGA TC 
ser arg arg gin arg pro arg 



SEQ ID N° 4B» 
FIGURE 4B' 



1/1 

GCC GCG CGC GAC TTC 
ala ala arg asp phe 
61/21 

TCG CAG CAA GCG GTC 
ser gin gin ala val 
121/41 

CGA GTC GTC GTC AAC 
arg val val val asn 



CAG ACA TTT GTT GTG 
gin thr phe val val 

TCC GGG TCG CAG CAT 
ser gly ser gin his 

GAC CAC GAT C 
asp his asp 



31/11 

GTT TCG GTT GAG GCC 
val ser val glu ala 
91/31 

CGT TGC GGC GAT CGC 
arg cys gly asp arg 



GAG GCG AGG CTC ATT 
glu ala arg leu ile 

GGC GCA GTC GTC GGA 
gly ala val val gly 



SEQ ID N° 4C 
FIGURE 4C 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



11/185 

ORF d'apres par Cole et al. (Nature 393:537-544) et contenant la sequence Seq 
4A' 



1 /1 
1/ 1 












"X i /i 1 














tga ata 


agt ccg ccg 


cgc 


gcg act 


_ ~ 

LCC 


aga 


cat ttg 


ttg tgg 




egg ttg 


agg ccg 


agg 


Ann « 1 n 


ser pro pro 


arg 


ala the 


ser 


arg 


uis leu 


leu trp 


phe 


arg leu 


arg pro 


arg 


til/ Zl 




























tea ttt cgc 


age 


aag egg 


tct 


ccg 




age 


ate 


gtt 


gcg gcg 


ate gcg 


gcg 


arg gly 


ser phe arg 


ser 


lys arg 


ser 


pro 


gly arg 


ser 


ile 


val 


ala ala 


ile ala 


ala 


121/41 












151/51 














cag teg 


teg gac gag 


teg 


teg tea 


a eg 


acc 


acg ate 


teg 


aac 


teg 


acg ccc 


tec tgt 


teg 


gin ser 


ser asp glu 


ser 


ser ser 


thr 


thr 


thr ile 


ser 


asn 


ser 


thr pro 


ser cys 


ser 


181/61 












211/71 












agg atg 


eta cgc aga 


cag 


cgc teg 


atg 


gtg 


gcg ccg 


ttg 


ttg 


tac 


ate ggg 


atg cac 


acc 


arg met 


leu arg arg gin 


arg ser 


met 


val 


ala pro 


leu 


leu 


tyr 


ile gly met his 


thr 


241/81 












271/91 














gag ata 


age ggt ttc 


gec 


ggg ttc 


acc 


gat 


acc acg 


ctt 


gat 


gca 


tea cca 


ggc acc 


aca 


glu ile 


ser gly phe ala gly phe 


thr 


asp 


thr thr 


leu 


asp 


ala 


ser pro gly thr 


thr 



301/101 

tgg cga etc aga gac tag 
trp arg leu acg asp AMB 



SEQ ID N° 4F 



FIGURE 4F 



sequence en amont de seq4A 1 et en fusion avec seq4A* 
1/1 31/11 

GCA ACC TAC CAG CAG AGC CAG GGG CTC ACA GGA CCT AAA GGA GTA GCG CCC ATG GCT GAT 
ala thr tyr gin gin ser gin gly leu thr gly pro lys gly val ala pro met ala asp 

C 

SEQ ID N° 4J 



FIGURE 4 J 



seq4J' dans une autre phase de lecture 

1/1 31/11 

ACG CAA CCT ACC AGC AGA GCC AGG GGC TCA CAG GAC CTA AAG GAG TAG CGC CCA TGG CTG 

thr gin pro thr ser arg ala arg gly ser gin asp leu lys glu AMB arg pro trp leu 

61/21 

ATC 

ile 

SEQ ID N°4K 
FIGURE 4K 



seq 4J' dans la troisx^me phase de lecture 
1/1 31/11 

CGC AAC CTA CCA GCA GAG CCA GGG GCT CAC AGG ACC TAA AGG AGT AGC GCC CAT GGC TGA 
arg asn leu pro ala glu pro gly ala his arg thr OCH arg ser ser ala his gly OPa 

TC 

SEQ ID N° 4L 



FEUILLE DE REMpOfflfel^(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



12/185 



sequence Rv2050 predite par 
1/1 

ATG GCT GAT CGT GTC CTG AGG 
Met ala asp arg val Igu arg 
61/21 

AAC CAC GAC CTG GCG CCG CGC 
asn his asp leu ala pro arg 
121/41 

GAA GTC CCG TTC GCC GAT GAC 
glu val pro phe ala asp a3p 
181/61 

GAA GGC ACC CTG ATC GAG GGC 
glu gly thr leu ile glu gly 
241/81 

CAC TGG GAC ATG CTG CTG GAG 
his trp asp met leu leu glu 
301/101 

CGC CTC GAG CTC ATT CGG TCA 
arg leu glu leu ile arg ser 



Cole et 


al. 


(Nature 393 








31/11 


GGC 


AGT 


CGC 


CTC GGA GCC 


gly 


ser 


arg 


leu gly ala 








91/31 


CAG 


ATC 


GCG 


CGG TAC CGC 


gin 


ile 


ala 


arg tyr arg 








151/51 


GCC 


GAG ATC 


CCC GGC ACC 


ala 


glu ile 


pro gly thr 








211/71 


GAC 


CTG 


ccc 


GAG CCG AAG 


asp 


leu 


pro 


glu pro lys 








271/91 


CGC 


CGT 


TCC 


ATC GAA GAA 


arg 


arg 


ser 


ile glu glu 








331/111 


CGT 


CGG 


CGC 


GGC TGA 


arg 


arg 


arg 


gly OPA 



SEQ ID N° 4M 
FIGURE 4M 



537-544) et contenant seq4J 



GTG 


AGC 


TAT 


GAG 


ACC 


GAC 


CGC 


val 


ser 


tyr glu 


t- V, w- 

tnr 


asp 


arg 


ACC 


GAC 


AAC 


GGC 


GAG 


GAG 


TTC 


thr 


asp 


asn 


gly 


glu 


glu 


phe 


TGG 


TTG 


TGC 


CGC 


AAC 


GGC 


ATG 


trp 


leu 


cys 


arg 


asn 


gly 


met 


AAG 


GTT 


AAG 


CCG 


CCC 


CGG 


ACG 


lys 


val 


lys 


pro 


pro 


arg 


thr 


CTC 


GAA 


GAG 


TTA 


CTT 


AAG 


GAG 


leu 


glu 


glu leu 


leu 


lys 


glu 



ORF d'apres par Cole et al . 
1/1 

TAG TCC GCC CGG GTG TCC GAT 
AMB ser ala arg val ser asp 
61/21 

CGG GAA CTA CGC AGA CGG CCG 
arg glu leu arg arg arg pro 
121/41 

TAC CAG CAG AGC CCA GGG CTC 
tyr gin gin ser pro gly leu 
181/61 

CTG AGG GGC AGT CGC CTC GGA 
leu arg gly ser arg leu gly 
241/81 

CCG CGC CAG ATC GCG CGG TAC 
pro arg gin ile ala arg tyr 
301/101 

GAT GAC GCC GAG ATC CCC GGC 
asp asp ala glu ile pro gly 
361/121 

GAG GGC GAC CTG CCC GAG CCG 
glu gly asp leu pro glu pro 
421/141 

CTG GAG CGC CGT TCC ATC GAA 
leu glu arg arg ser ile glu 
481/161 

CGG TCA CGT CGG CGC GGC TGA 
arg ser arg arg arg gly OPA 



(Nature 


393: 


537-S44) 


et 








31/U 




CCC 


GGT 


ATC 


ATT GAT 


GGT 


pro gly 


ile 


ile asp 


gly 








91/31 




CAG 


CGT 


TTG 


CCA ACC 


GGA 


gin 


arg 


leu 


pro thr 


gly 








151/51 




ACA 


GGA 


CCT 


AAA GGA 


GTA 


thr gly 


pro 


lys gly 


val 








211/71 




GCC 


GTG 


AGC 


TAT GAG 


ACC 


ala 


val 


ser 


tyr glu 


thr 








271/91 




CGC 


ACC 


GAC 


AAC GGC 


GAG 


arg 


thr 


asp 


asn gly 


glu 








331/111 




ACC 


TGG 


TTG 


TGC CGC 


AAC 


thr 


trp 


leu 


cys arg 


asn 








391/131 




AAG 


AAG 


GTT 


AAG CCG 


CCC 


lys 


lys 


val 


lys pro 


pro 








451/151 




GAA 


CTC 


GAA 


GAG TTA 


CTT 


glu 


leu 


glu 


glu leu 


leu 



contenant la sequence Rv2050 



CGC 


GCC 


GCG 


CGC 


GTC 


GCG 


TGC 


arg 


ala 


ala 


arg 


val 


ala 


cys 


GCC 


AGT 


CGC 


CAG 


TAC 


GCA 


ACC 


ala 


ser 


arg 


gin 


tyr 


ala 


thr 


GCG 


CCC 


ATG 


GCT 


GAT 


CGT 


GTC 


ala 


pro 


met 


ala 


asp 


arg 


val 


GAC 


CGC 


AAC 


CAC 


GAC 


CTG 


GCG 


asp 


arg 


asn 


his 


asp 


leu 


ala 


GAG 


TTC 


GAA 


GTC 


CCG 


TTC 


GCC 


glu 


phe 


glu 


val 




phe 


ala 


GGC 


ATG 


GAA 


GGC 


ACC 


CTG 


ATC 


gly 


met 


glu 


gly 


thr 


leu 


ile 


CGG 


ACG 


CAC 


TGG 


GAC 


ATG 


CTG 


arg 


thr 


his 


trp 


asp 


met 


leu 


AAG 


GAG 


CGC 


CTC 


GAG 


CTC 


ATT 


lys 


glu 


arg 


leu 


glu 


leu 


ile 



SEQ ID N° 4N 
FEUILLE DE REMPI^EJIf NJ (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



13/185 



31/11 

GAT CGC GGT CAA CGA GGC CGA ATA CGG CGA GAT GTG GGC CCA AGA CGC CGC CGC GAT GTT 
asp arg gly gin arg gly arg ile arg arg asp val gly pro arg arg arg arg asp val 
61/21 91/31 

TGG CTA CGC CGC GGC GAC GGC GAC GGC GAC GGC GAC GTT GCT GCC GTT CGA GGA GGC GCC 
trp leu arg arg gly asp gly asp gly asp gly asp val ala ala val arg gly gly ala 
121/41 151/51 

GGA GAT GAC CAG CGC GGG TGG GCT CCT CGA GCA GGC CGC CGC GGT CGA GGA GGC CTC CGA 
gly asp asp gin arg gly trp ala pro arg ala gly arg arg gly arg gly gly leu arg 
181/61 211/71 

CAC CGC CGC GGC GAA CCA GTT GAT GAA CAA TGT GCC CCA GGC GCT GCA ACA GCT GGC CCA 
his arg arg gly glu pro val asp glu gin cys ala pro gly ala ala thr ala gly pro 
241/81 271/91 

GCC CAC GCA GGG CAC CAC GCC TTC TTC CAA GCT GGG TGG CCT GTG GAA GAC GGT CTC GCC 
ala his ala gly his his ala phe phe gin ala gly trp pro val glu asp gly leu ala 
301/101 

GCA TCG GTC GCC GAT C 
ala ser val ala asp 



SEQ ID K° 5A 
FIGURE SA 



• 32/11 

ATC GCG GTC AAC GAG GCC GAA TAC GGC GAG ATG TGG GCC CAA GAC GCC GCC GCG ATG TTT 
ile ala val asn glu ala glu tyr gly glu met trp ala gin asp ala ala ala met phe 
62/21 92/31 

GGC TAC GCC GCG GCG ACG GCG ACG GCG ACG GCG ACG TTG CTG CCG TTC GAG GAG GCG CCG 
gly tyr ala ala ala thr ala thr ala thr ala thr leu leu pro one glu glu a^a pro 
122/41 152/51 J 

GAG ATG ACC AGC GCG GGT GGG CTC CTC GAG CAG GCC GCC GCG GTC GAG GAG GCC TCC GAC 
glu met thr ser ala gly gly leu leu glu gin ala ala ala val glu glu ala ser asp 
182/61 212/71 

ACC GCC GCG GCG AAC CAG TTG ATG AAC AAT GTG CCC CAG GCG CTG CAA CAG CTG GCC CAG 
thr ala ala ala asn gin leu met asn asn val pro gin ala leu gin gin leu ala qln 
242/81 272/91 

CCC ACG CAG GGC ACC ACG CCT TCT TCC AAG CTG GGT GGC CTG TGG AAG ACG GTC TCG CCG 
pro thr gin gly thr thr pro ser ser lys leu gly gly leu trp lys thr val ser pro 
302/101 

CAT CGG TCG CCG ATC 
his arg ser pro ile 



SEQ ID N° 5B 
FIGURE 5B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT7FR98/01813 



14/185 



33/1X 

TCG CGG TCA ACG AGG CCG AAT ACG GCG AGA TGT GGG CCC MG ACG CCG CCG CGA TGT TTG 
ser arg ser thr arg pro asn thr ala arg cys gly pro lys thr pro pro arg cys leu 
63/21 93/31 

GCT ACG CCG CGG CGA CGG CGA CGG CGA CGG CGA CGT TGC TGC CGT TCG AGG AGG CGC CGG 
ala thr pro arg arg arg arg arg arg arg arg arg cys cys arg ser arg arg arg arg 
123/41 153/51 

AGA TGA CCA GCG CGG GTG GGC TCC TCG AGC AGG CCG CCG CGG TCG AGG AGG CCT CCG ACA 
arg OPA pro ala arg val gly ser ser ser arg pro pro arg ser arg arg pro pro thr 
183/61 213/71 

CCG CCG CGG CGA ACC AGT TGA TGA ACA ATG TGC CCC AGG CGC TGC AAC AGC TGG CCC AGC 
pro pro arg arg thr ser OPA OPA thr met cys pro arg arg cys asn ser trp pro ser 
243/81 ' 273/91 

CCA CGC AGG GCA CCA CGC CTT CTT CCA AGC TGG GTG GCC TGT GGA AGA CGG TCT CGC CGC 
pro arg arg ala pro arg leu leu pro ser trp val ala cys gly arg arg ser arg arg 
303/101 

ATC GGT CGC CGA TC 
lie gly arg arg 



SEQ ID N° 5C 
FIGURE 5C 



partie de la sequence nucleotidique Seq 5A 
1/1 31/11 

CGC CGC GGC GAC GGC GAC GGC GAC GGC GAC GTT GCT GCC GTT CGA GGA GGC GCC GGA GAT 
arg arg gly asp gly asp gly asp gly asp val ala ala val arg gly gly ala gly asp 
61/21 91/31 

GAC CAG CGC GGG TGG GCT CCT CGA GCA GGC CGC CGC GGT CGA GGA GGC CTC CGA CAC CGC 
asp gin arg gly trp ala pro arg ala gly arg arg gly arg gly gly leu arg his arg 
121/41 151/51 

CGC GGC GAA CCA GTT GAT GAA CAA TGT GCC CCA GGC GCT GCA ACA GCT GGC CCA GCC CAC 
arg gly glu pro val asp glu gin cys ala pro gly ala ala thr ala gly pro ala his 
181/61 * 271/71 

GCA GGG CAC CAC GCC TTC TTC CAA GCT GGG TGG CCT GTG GAA GAC GGT CTC GCC GCA TCG 
ala gly his his ala phe phe gin ala gly trp pro val glu asp gly leu ala ala ser 
241/81 

GTC GCC GAT C 
val ala asp 



SEQ ID N° 5A 1 
FIGURE 5A l 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



15/185 



1/1 31/11 

TAC GCC GCG GCG ACG GCG ACG GCG ACG GCG ACG TTG CTG CCG TTC GAG GAG GCG CCG GAG 
tyr ala ala ala thr ala thr ala thr aia thr leu leu pro phe glu glu ala pro glu 
61/21 91/31 

ATG ACC AGC GCG GGT GGG CTC CTC GAG CAG GCC GCC GCG GTC GAG GAG GCC TCC GAC ACC 
met thr ser ala gly gly leu leu glu gin ala ala ala val glu glu ala ser asp thr 
121/41 151/51 

GCC GCG GCG AAC CAG TTG ATG AAC AAT GTG CCC CAG GCG CTG CAA CAG CTG GCC CAG CCC 
ala ala ala asn gin leu met asn asn val pro gin ala leu gin gin leu ala gin pro 
181/61 211/71 

ACG CAG GGC ACC ACG CCT TCT TCC AAG CTG GGT GGC CTG TGG AAG ACG GTC TCG CCG CAT 
thr gin gly thr thr pro ser ser lys leu gly gly leu trp lys thr val ser pro his 
241/81 

CGG TCG CCG ATC 
arg ser pro ile 



SEQ ID K° 5B 1 
FIGURE SB' 



1/1 

ACG CCG CGG CGA CGG 
thr pro arg arg arg 
61/21 

TGA CCA GCG CGG GTG 
OPA pro ala arg val 
121/41 

CCG CGG CGA ACC AGT 
pro arg arg thr ser 
181/61 

CGC AGG GCA CCA CGC 
arg arg ala pro arg 
241/81 

GGT CGC CGA TC 
gly arg arg 



CGA CGG CGA CGG CGA 
arg arg arg arg arg 

GGC TCC TCG AGC AGG 
gly ser ser ser arg 

TGA TGA ACA ATG TGC 
OPA OPA thr met cys 

CTT CTT CCA AGC TGG 
leu leu pro ser trp 



31/11 

CGT TGC TGC CGT TCG 
arg cys cys arg ser 
91/31 

CCG CCG CGG TCG AGG 
pro pro arg ser arg 
151/51 

CCC AGG CGC TGC AAC 
pro arg arg cys asn 
211/71 

GTG GCC TGT GGA AGA 
val ala cys gly arg 



AGG AGG CGC CGG AGA 
arg arg arg arg arg 

AGG CCT CCG ACA CCG 
arg pro pro thr pro 

AGC TGG CCC AGC CCA 
ser trp pro ser pro 

CGG TCT CGC CGC ATC 
arg ser arg arg ile 



SEQ ID N° 5C f 
FIGURE 5C 



FEUILLE DE REMPLACEIWENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



16/185 



ORF predite par Cole et al. (Nature 393:537-544) et contenant seqSA' 
1/1 31/11 

tga act gat gat tct gat age gac caa cct ctt ggg gca aaa cac ccc ggc gat cgc ggt 
OPA thr asp asp ser asp ser asp gin pro leu gly ala lys his pro gly asp arg gly 
61/21 91/31 

caa cga ggc cga ata egg cga gat gtg ggc cca aga cgc cgc cgc gat gtt tgg eta cgc 
gin arg gly arg ile arg arg asp val gly pro arg arg arg arg asp val trp leu arg 
121/41 151/51 

cgc ggc gac ggc gac ggc gac ggc gac gtt get gcc gtt cga gga ggc gcc gga gat gac 
arg gly asp gly asp gly asp gly asp val ala ala val arg gly gly ala gly asp asp 
181/61 211/71 

cag cgc ggg tgg get cct cga gca ggc cgc cgc ggt cga gga ggc etc cga cac cgc cgc 
gin arg gly trp ala pro arg ala gly arg arg gly arg gly gly leu arg his arg arg 
241/81 271/91 

ggc gaa cca gtt gat gaa caa tgt gcc cca ggc get gca aca get ggc cca gcc cac gca 
gly glu pro val asp glu gin cys ala pro gly ala ala thr ala gly pro ala his ala 
301/101 331/111 

ggg cac cac gcc etc ttc caa get ggg tgg cct gtg gaa gac ggt etc gcc gca teg gtc 
gly his his ala phe phe gin ala gly trp pro val glu asp gly leu ala ala ser val 
361/121 391/131 

gcc gat cag caa cat ggt gtc gat ggc caa caa cca cat gtc gat gac caa etc ggg tgt 
ala asp gin gin his gly val asp gly gin gin pro his val asp asp gin leu gly cys 
421/141 451/151 

gtc gat gac caa cac ctt gag etc gat gtt gaa ggg ctt tgc tec ggc ggc ggc cgc cca 
val asp asp gin his leu glu leu asp val glu gly leu cys ser gly gly gly arg pro 
481/161 511/171 

ggc cgt gca aac cgc ggc gca aaa egg ggt ccg ggc gat gag cte get ggg cag etc get 
gly arg ala asn arg gly ala lys arg gly pro gly asp glu leu ala gly gin leu ala 
541/181 . 571/191 

ggg ttc ttc ggg tct ggg egg tgg ggt ggc cgc caa ctt ggg teg ggc ggc etc ggt egg 
gly phe phe gly ser gly arg trp gly gly arg gin leu gly ser gly gly leu gly arg 
601/201 631/211 

ttc gtt gtc .ggt gcc gca ggc ctg ggc cgc ggc caa cca ggc agt cac ccc ggc ggc gcg 
phe val val gly ala ala gly leu gly arg gly gin pro gly ser his pro gly gly ala 
661/221 691/231 

ggc get gcc get gac cag cct gac cag cgc cgc gga aag agg gcc egg gca gat get ggg 
gly ala ala ala asp gin pro asp gin arg arg gly lys arg ala arg ala asp ala gly 
721/241 751/251 

egg get gcc ggt ggg gca gat ggg cgc cag ggc egg tgg tgg get cag tgg tgt get gcg 
arg ala ala gly gly ala asp gly arg gin gly arg trp trp ala gin trp cys ala ala 
781/261 811/271 

tgt tec gcc gcg ace eta tgt gat gee gca ttc tec ggc ggc egg eta gga gag ggg gcg 
cys ser ala ala thr leu cys asp ala ala phe ser gly gly arg leu gly glu gly ala 
841/281 

cag act gtc gtt att tga 
gin thr val val ile OPA 



SEQ ID N° 5F 
FIGURE 5F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



tCC 

ser 


gcg 
ala 


agg 
arg 


atg 
met 


tac 
tyr 


gcc 
ala 


ggc 

gly 


ccg 
pro 


gac 
asp 


age 
ser 


gtg 

val 


gcg 
ala 


agt 
ser 


gac 
asp 


ctg 
leu 


ttt 
phe 


ctg 
leu 


acg 
thr 


gtg 
val 


ggg 
giy 


teg 
ser 


tgg 
trp 


ata 
ile 


ggt 
gly 


tat 


gtg 


gcg 


tgg 


atg 


age 


gtc 


acc 



17/185 

sequence Ryll96 predite par Cole et al. (Nature 393:537-544) et pouvant coder pour une 
ORF en fusion avec SeqSA' 

1/1 31/11 
atg gtg gat ttc ggg gcg tta cca ccg gag ate aac 
Met val asp phe gly ala leu pro pro glu ile asn 
61/21 91/31 
ggt teg gcc teg ctg gtg gcc gcg get cag atg tgg 
gly ser ala ser leu val ala ala ala gin met trp 
121/41 151/51 
teg gcc gcg teg gcg ttt cag teg gtg gtc tgg ggt 
ser ala ala ser ala phe gin ser val val trp gly 
181/61 211/71 
teg teg gcg ggt ctg atg gtg gcg gcg gcc teg ccg 
ser ser ala gly leu met val ala 
ala ala ser pro tyr val ala trp met ser val thr 
241/81 271/91 

gcg ggg cag gcc gag ctg acc gcc gcc cag gtc egg gtt get gcg gcg gcc tac gag acg 
ala gly gin ala glu leu thr ala ala gin val arg val ala ala ala ala tyr glu thr 
301/101 331/111 

gcg tat ggg ctg acg gtg ccc ccg ccg gtg ate gcc gag aac cgt get gaa ctg atg att 
ala tyr gly leu thr val pro pro pro val ile ala glu asn arg ala glu leu met ile 
361/121 391/131 

ctg ata gcg acc aac etc ttg ggg caa aac acc ccg gcg ate gcg gcc aac gag gcc gaa 
leu ile ala thr asn leu leu gly gin asn thr pro ala ile ala val asn glu ala glu 
421/141 451/151 

tac ggc gag atg tgg gcc caa gac gcc gcc gcg atg ttt ggc tac gcc gcg gcg acg gcg 
tyr gly glu met trp ala gin a3p ala ala ala met phe gly tyr ala ala ala thr ala 
481/161 511/171 

acg gcg acg gcg acg ttg ctg ccg ttc gag gag gcg ccg gag atg acc age gcg ggt ggg 
thr ala thr ala thr leu leu pro phe glu glu ala pro glu met thr ser ala qlv alv 
541/181 571/191 

etc etc gag cag gcc gcc gcg gtc gag gag gcc tec gac acc gcc gcg gcg aac cag ttg 
leu leu glu gin ala ala ala val glu glu ala ser asp the ala ala ala asn gin leu 
601/201 631/211 

atg aac aat gtg ccc cag gcg ctg caa cag ctg gcc cag ccc acg cag ggc ace acg cct 
met asn asn val pro gin ala leu gin gin leu ala gin pro thr gin gly thr thr pro 
661/221 691/231 

tct tec aag ctg ggt ggc ctg tgg aag acg gtc teg ccg cat egg teg ccg ate age aac 
ser ser lys leu gly gly leu trp lys thr val ser pro his arg ser pro ile ser asn 
721/241 751/251 

atg gtg teg atg gcc aac aac cac atg teg atg acc aac teg ggt gtg teg atg acc aac 
met val ser met ala asn asn his met ser met thr asn ser gly val ser met thr asn 
781/261 811/271 

acc ttg age teg atg ttg aag ggc ttt get ccg gcg gcg gcc gcc cag gcc gtg caa acc 
thr leu ser ser met leu lys gly phe ala pro ala ala ala ala gin ala val gin thr 
841/281 871/291 

gcg gcg caa aac ggg gtc egg gcg atg age teg ctg ggc age teg ctg ggt tct teg ggt 
ala ala gin asn gly val arg ala met ser ser leu gly ser ser leu gly ser ser alv 
901/301 931/311 9 Y 

ctg ggc ggt ggg gtg gcc gcc aac ttg ggt egg gcg gcc teg gtc ggt teg ttg teg gtg 
leu gly gly gly val ala ala asn leu gly arg ala ala ser val gly ser leu ser val 
961/321 991/331 



val 



ccg cag gcc 


tgg 


gcc 


gcg 


gcc 


aac 


cag 


gca gtc acc ccg 


gcg 


gcg 


pro gin ala 


trp 


ala 


ala 


ala 


asn 


gin 


ala val thr pro 


ala 


ala 


1021/341 












1051/351 






acc age ctg 


acc 


age 


gcc 


gcg 


gaa 


aga 


ggg ccc ggg cag 


atg 


ctg 


thr ser leu 


thr 


ser 


ala 


ala 


glu 


arg 


gly pro gly gin 


met 


leu 


1081/361 














1111/371 






ggg cag atg 


ggc 


gcc 


agg 


gcc 


ggt 


ggt 


ggg etc agt ggt 


gtg 


ctg 


gly gin met 


gly 


ala 


arg 


ala 


gly 


gly 


gly leu ser gly 


val 


leu 


1141/381 














1171/391 






ccc tat gtg 


atg 


ccg 


cat 


tct 


ccg 


gcg 


gcc ggc tag 






pro tyr val 


met 


pro 


his 


ser 


pro 


ala 


ala gly AMB 







SEQ ID N° 5R 



FIGURE 5R 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



18/185 

Seq 5P: ORF d'apres Cole et al. (Nature 393:537-544) et covenant la sequence RV1196 
1/1 31/11 

tag gga cac gta atg gtg gat ttc ggg gcg tta cca ccg gag ate aac tec gcg ago ata 

AMB gly his val met val asp phe gly ala leu pro pro glu ile asn ser ala arg met 
61/21 9X/31 * 

tac gec ggc ccg ggt teg gec teg ctg gtg gec gcg get cag atg tgg gac age gtg gcg 

tyr ala gly pro gly ser ala ser leu val ala ala ala gin met trp asp ser val ala 
121/41 151/51 

agt gac ctg ttt teg gec gcg teg gcg ttt cag teg gtg gtc tgg ggt ctg acg gtg ggg 

3 er asp leu phe ser ala ala ser ala phe gin ser val val trp gly leu thr val alv 
181/61 211/71 

teg tgg ata ggt teg teg gcg ggt ctg atg gtg gcg gcg gee teg ccg tat gtg g cg tag 

ser trp ile gly ser ser ala gly leu met val ala ala ala ser pro tyr val ala tro 
241/81 271/91 ^ 

atg age gtc aec gcg ggg cag gee gag ctg acc gee gec cag gtc egg gtt get gcg aca 

met ser val thr ala gly gin ala glu leu thr ala ala gin val arg val ala ala ala 
301/101 331/111 

gee tac gag acg gcg tat ggg ctg acg gtg ccc ccg ccg gtg ate gee gag aac cgt get 

9lU thr ala tyr gly leU thr Val pro P ro P ro val ilG ala 91^ aan arg ala 
361/121 391/131 * 

gaa ctg atg att ctg ata gcg acc aac etc ttg ggg caa aac acc ccg gcg ate gcg gtc 

?i?,«? U met Xle leU 116 ala thr a3n 1<?u leu ^ 9ln asn thr pro ala ile ala val 
421/141 451/151 

aac gag gec gaa tac ggc gag atg tgg gec caa gac gec gec gcg atg ttt gge tac gec 

ala glU tyr 9ly glU met trp ala gln a3 P ala ala met P he gly tyr ala 
481/161 511/171 

gcg gcg acg gcg acg gcg acg gcg acg ttg ctg ccg ttc gag gag gcg ccg gag atg acc 

541/181 tht Pr ° PhC 9lU glU ala Pr ° glU met thr 

age gcg ggt ggg etc etc gag cag gee gee gcg gtc gag gag gec tec gac acc gec gcg 
ser ala gly gly leu leu glu gin ala ala ala val glu glu ala aer asp thr ala ala 
601/201 631/211 

gcg aac cag ttg atg aac aat gtg ccc cag gcg ctg caa cag ctg gec cag ccc acg cag 
ala asn gin leu met asn asn val pro gin ala leu gin gin leu ala gin pro thr gin 
661/221 691/231 

ggc acc acg cet tct tec aag ctg ggt ggc ctg tgg aag acg gtc teg ccg cat egg teg 

?i^f thr Pr ° 3er 3er lyS lGU gly gXy leu tr P ^ thr val 3e * Pro hi 3 arg ser 
721/241 751/251 

ccg ate age aac atg gtg teg atg gee aac aac cac atg teg atg acc aac teg ggt gtg 
pro ile ser asn met val ser met ala asn asn his met ser met thr asn ser qlv val 
781/261 811/271 

teg atg acc aac acc ttg age teg atg ttg aag ggc ttt get ccg gcg gcg gee gee cag 
ser met thr asn thr leu ser ser met leu lys gly phe ala pro ala ala ala ala gin 
841/281 871/291 

gec gtg caa acc gcg gcg caa aac ggg gtc egg gcg atg age teg ctg ggc age teg ctg 
ala val gin thr ala ala gin asn gly val arg ala met ser ser leu gly ser ser leu 
901/301 931/311 

ggt tct teg ggt ctg ggc ggt ggg gtg gee gec aac ttg ggt egg gcg gec teg gtc ggt 
gly ser ser gly leu gly gly gly val ala ala asn leu gly arg ala ala ser val glv 
961/321 991/331 

teg ttg teg gtg ccg cag gee tgg gec gcg gec aac cag gca gtc acc ccg gcg gcg egg 
ser leu ser val pro gin ala trp ala ala ala asn gin ala val thr pro ala ala ara 
1021/341 1051/351 

gcg ctg ccg ctg acc age ctg acc age gec gcg gaa aga ggg ccc ggg cag atg ctg ggc 

1 361 P llli eU 7 tHr ^ 3QJC ^ 9ly Pr ° gly gln leU 9ly 

ggg ctg ccg gtg ggg cag atg ggc gec agg gec ggt ggt ggg etc agt ggt gtg ctg cgt 
gly leu pro val gly gln met gly ala arg ala gly gly gly ieu 3er gly val leu ara 
1141/381 1171/391 
gtt ccg ccg cga ccc tat gtg atg ccg cat tct ccg gcg gec ggc tag 
val pro pro arg pro tyr val met pro his ser pro ala ala gly AMB 



SEQ ID N° 5P 



FEU1LLE DE REMI^S^Elft (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



19/185 



31/11 



GGA TCC 


TGA 


TGC 


AAG 


TGG 


TCC 


GGG ATT TGT 


CGG CAG CCA CCG 


CGG TCC 


CGT 


CGA 


CCA ACG 


gly ser 


OPA 


cys 


lys 


trp ser gly ile cys 


arg gin pro arg 


arg ser 


arg 


arg 


pro 


thr 


61/21 














91/31 








TTG GTG 


CAT 


CCG 


GGC 


TGC 


GAG 


CAT GCA CGC 


ACC GAC CAG 


CGC 


GGC GAG 


CGC 


GGC 


TAG 


CTG 


leu val 


his 


pro gly 


cys glu his ala arg 


thr asp gin arg 


gly glu 


arg 


gly 


AMB 


leu 


121/41 














151/51 








CTT GCC 


CAC 


TGT 


TCC 


TCC 


CTG 


CCG GCA CCA 


TGT GCG ACA AGC 


TTA AGC 


GCA 


GCA 


GTA 


CCG 


leu ala 


his 


cys 


ser 


ser 


leu 


pro ala pro 


cys ala thr 


ser 


leu ser 


ala 


ala 


val 


pro 


181/61 














211/71 










GCG GTG 


CCT 


GGG 


CAT 


CCA 


GCA AAA CGG GGA 


GCT CAA GAA 


CGA 


TTC ATG 


AAC 


GAG 






ala val 


pro 


gly his 


pro 


ala 


lys arg gly 


ala gin glu 


arg 


phe met 


asn 


glu 


gly 


sec 


241/81 














271/91 








TCA CCA ACG 


TCG AAA 


CCG ACG 


GTT GCC AGC 


CGG CCC ACG 


ATA 


TTG CGT 


GCT 


CGA 


GGG 


TCC 


ser pro 


thr 


ser 


lys 


pro 


thr 


val ala ser 


arg pro thr 


ile 


leu arg 


ala 


arg 


gly 


ser 


301/101 














331/111 






GCT GTA 


CCC 


TCA 


CCG 


AAC 


GTG 


AGT CCC ACA 


CCG CGG AGG 


CGG 


GCG ACT 


CTG 


GCG 


TCG 


TTA 


ala val 


pro 


ser 


pro 


asn 


val 


ser pro thr 


pro arg arg 


arg 


ala thr 


leu 


ala 


ser 


leu 


361/121 














391/131 








GCA GCC 


GAG 


CTC 


AAG 


GTG 


TCC 


CGC ACC ACT 


GTC TCG AAT 


GCT 


TTT AAC 


CGA 


CCG 


GAT 


CCA 


ala ala 
421/141 


glu 


leu 


lys 


val 


ser 


arg thr thr 


val ser asn 


ala 


phe asn 


arg 


pro 


asp 


pro 


GAA GGA 


GAA 


GAT 


C 























glu gly glu asp 

SEQ ID N° 6A 
FIGURE 6A 



GAT CCT GAT GCA AGT 
asp pro asp ala ser 
62/21 

TGG TGC ATC CGG GCT 
trp cys ile arg ala 
122/41 

TTG CCC ACT GTT CCT 
leu pro thr val pro 
182/61 

CGG TGC CTG GGC ATC 
arg cys leu gly ile 
242/81 

CAC CAA CGT CGA AAC 
his gin arg arg asn 
302/101 

CTG TAC CCT CAC CGA 
leu tyr pro his arg 
362/121 

CAG CCG AGC TCA AGG 
gin pro ser ser arg 
422/141 

AAG GAG AAG ATC 
lys glu lys ile 



GGT 


CCG 


GGA 


TTT 


GTC 


gly pro 


gly phe 


val 


GCG 


AGC 


ATG 


CAC 


GCA 


ala 


ser 


met 


his 


ala 


CCC 


TGC 


CGG 


CAC 


CAT 


pro 


cys 


arg 


his 


his 


CAG 


CAA AAC 


GGG 


GAG 


gin 


gin 


asn 


gly 


glu 


CGA 


CGG 


TTG 


CCA 


GCC 


arg 


arg 


leu 


pro 


ala 


ACG 


TGA 


GTC 


CCA 


CAC 


thr 


OPA 


val 


pro 


his 


TGT 


CCC 


GCA 


CCA 


CTG 


cys 


pro 


ala 


pro 


leu 



SEQ 



32/11 

GGC AGC CAC GGC GGT 
gly ser his gly gly 
92/31 

CCG ACC AGC GCG GCG 
pro thr ser ala ala 
152/51 

GTG CGA CAA GCT TAA 
val arg gin ala OCH 
212/71 

CTC AAG AAC GAT TCA 
leu lys asn asp ser 
272/91 

GGC CCA CGA TAT TGC 
gly pro arg tyr cys 
332/111 

CGC GGA GGC GGG CGA 
arg gly gly gly arg 
392/131 

TCT CGA ATG CTT TTA 
ser arg met leu leu 



N° 6B 



CCC 


GTC 


GAC 


CAA 


CGT 


pro 


val 


asp 


gin 


arg 


AGC 


GCG 


GCT 


AGC 


TGC 


ser 


ala 


ala 


ser 


cys 


GCG 


CAG 


CAG 


TAC 


CGG 


ala 


gin 


gin 


tyr 


arg 


TGA 


ACG 


AGG 


GGT 


CGT 


OPA 


thr 


arg 


gly arg 


GTG 


CTC 


GAG 


GGT 


CCG 


val 


leu 


glu 


gly 


pro 


CTC 


TGG 


CGT 


CGT 


TAG 


leu 


trp 


arg 


arg 


AMB 


ACC 


GAC 


CGG 


ATC 


CAG 


thr 


asp 


arg 


ile gin 



FEUILLE DE REMPU^E^flEffPfREGLE 26) 



WO 99/09186 



PCT/FR98/01813 



20/185 



ATC CTG 


ATG 


CAA GTG 


GTC 


CGG 


ile leu 


met 


gin val 


val 


a j, y 


63/21 








GGT GCA 


TCC 


GGG CTG 


CGA 


GCA 


olv ala 


ser 


gly leu 


arg 


nl a 


123/41 










TGC CCA 




TTC CTC 


CCT 






leu 


phe leu pro 


aid 


183/61 










GGT GCC 


TGG 


GCA TCC AGC 


AAA 


gly ala 


trp 


ala ser 


ser 




243/81 








ACC AAC 


GTC 


GAA ACC 


GAC 


GGT 


thr asn 


val 


glu thr 


asp 


gly 


303/101 










TOT ACC 


CTC 


ACC GAA 


CGT 


GAG 


cys thr 


leu 


thr glu 


arg 


glu 


363/121 










AGC CGA 


GCT 


CAA GGT 


GTC 


CCG 


ser arg 


ala 


gin gly val 


pro 


423/141 










AGG AGA 


AGA 


TC 






arg arg 


arg 









33/11 

GAT TTG TCG GCA GCC ACG 
asp leu ser ala ala thr 
93/31 

TGC ACG CAC CGA CCA GCG 
cys thr his arg pro ala 
153/51 

GGC ACC ATG TGC GAC AAG 
gly thr met cys asp lys 

213/71 
ACG GGG AGC TCA AGA ACG 
thr gly ser ser arg thr 

273/91 
TGC CAG CCG GCC CAC GAT 
cys gin pro ala his asp 

333/111 
TCC CAC ACC GCG GAG GCG 
ser his thr ala glu ala 

393/131 
CAC CAC TGT CTC GAA TGC 
his his cys leu glu cys 



SEQ ID N° 6C 
FIGURE 6C 



GCG 


GTC 


CCG 


TCG 


ACC 


AAC 


GTT 


ala 


val 


pro 


ser 


thr 


asn 


val 


CGG 


CGA 


GCG 


CGG 


CTA 


GCT 


GCT 


arg 


arg 


ala 


arg 


leu 


ala 


ala 


CTT 


AAG 


CGC 


AGC 


AGT 


ACC 


GGC 


leu lys 


arg 


scr 


ser 


thr 


gly 


ATT 


CAT 


GAA 


CGA 


GGG 


GTC 


GTC 


ile 


his 


glu arg 


gly 


val 


val 


ATT 


GCG 


TGC 


TCG 


AGG 


GTC 


CGC 


ile 


! ala cys ser arg val ar< 


GGC 


GAC 


TCT 


GGC 


GTC 


GTT 


AGC 


gly 


asp 


ser 


gly val 


val 


ser 


TTT 


TAA 


CCG 


ACC 


GGA 


TCC 


AGA 


phe OCH pro thr gly 


ser 


arg 



















31/11 


















CCG TCG 


GCA 


ACT 


TGG CCG 


CTG 


AGG 


TCG 


GCT 


TGA TCC 


CTG 


GGC 


CGA GGC 


GGG 


TCA 


GCC 


AAT 


pro ser 
61/21 


ala 


thr 


trp pro 


leu 


arg 


ser 


ala 


OPA ser 
91/31 


leu 


gly arg gly gly 


ser 


ala 


asn 


AGC GGC 


TCC 


ATC 


GGC TTT 


GCT 


GGT 


AGC 


GGT 


TCG GCG 


GGA 


AGC 


TAG 


CGG 


CGA 


CGT 


TGT 


CGG 


ser gly 
121/41 


ser 


ile 


gly phe 


ala 


giy 


ser 


gly 


ser ala 
151/51 


gly 


ser 


AMB 


arg 


arg 


arg 


cys 


arg 


TGG CCG 


GTG 


ATA 


TAT TCG 


GTC 


AGA 


CGG 


GTA 


TGG CGG 


CGG 


CTG 


AGG 


TGA 


TCT 


GCG 


ACA 


CGC 


trp pro 
181/61 


val 


ile 


tyc trp 


val 


arg 


arg 


val 


trp arg 
211/71 


arg 


leu 


arg 


OPA 


ser 


ala 


thr 


arg 


CGC CGC 


GGT 


GCT 


CGA GCC 


AGG 


CTT 


ACG 


ACC 


AGG GAA 


TTT 


CGA 


AAA 


TGT 


TAT 


TCA 


GAA 


CAT 


arg arg 
241/81 


gly 


ala 


arg ala 


arg 


leu 


thr 


thr 


arg glu 
271/91 


phe 


arg 


lys 


cys 


tyr 


ser 


glu 


his 


CTT GTA 


TCT 


CTT 


CTC CGT 


GCC 


ACC 


CCC 


TAG 


GTG TAG 


TGT 


TTT 


CGA 


GTA 


CCG 


GCA 


GAT 


CCC 


leu val 
301/101 


ser 


leu 


leu arg 


ala 


thr 


pro 


AMB 


val AMB 


cys 


phe 


arg 


val 


pro 


ala 


asp 


pro 


AGG TTC 


ACC 


AGG 


TCT CAC 


CAG 


ATC 
























arg phe 


thr 


arg 


ser his 


gin 


ile 

























SEQ ID N° 7A 
FIGURE 7A 

FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/018J3 



21/185 



32/11 

CGT CGG CAA CTT GGC CGC TGA GGT CGG CTT GAT CCC TGG GCC GAG GCG GGT CAG CCA ATA 
arg arg gin leu gly arg OPA gly arg leu asp pro trp ala glu ala gly gin pro ile 
62/21 92/31 

GCG GCT CCA TCG GCT TTG CTG GTA GCG GTT CGG CGG GAA GCT AGC GGC GAC GTT GTC GGT 
ala ala pro ser ala leu leu val ala val arg arg glu ala ser gly asp val val gly 
122/41 152/51 

GGC CGG TGA TAT ATT GGG TCA GAC GGG TAT GGC GGC GGC TGA GGT GAT CTG CGA CAC GCC 
gly arg OPA tyr ile gly ser asp gly tyr gly gly gly OPA gly asp leu arg his ala 
182/61 212/71 

GCC GCG GTG CTC GAG CCA GGC TTA CGA CCA GGG AAT TTC GAA AAT GTT ATT CAG AAC ATC 
ala ala val leu glu pro gly leu arg pro gly asn phe glu asn val ile gin asn ile 
242/81 272/91 

TTG TAT CTC TTC TCC GTG CCA CCC CCT AGG TGT AGT GTT TTC GAG TAC CGG CAG ATC CCA 
leu tyr leu phe ser val pro pro pro arg cys ser val phe glu tyr arg gin ile pro 
302/101 

GGT TCA CCA GGT CTC ACC AGA TC 
gly ser pro gly leu thr arg 

SEQ ID N° 7B 
FIGURE 7B 



33/11 

GTC GGC AAC TTG GCC GCT GAG GTC GGC TTG ATC CCT GGG CCG AGG CGG GTC AGC CAA TAG 
val gly asn leu ala ala glu val gly leu ile pro gly pro arq arg val ser gin AMB 
63/21 93/31 

CGG CTC CAT CGG CTT TGC TGG TAG CGG TTC GGC GGG AAG CTA GCG GCG ACG TTG TCG GTG 
arg leu his arg leu cys trp AMB arg phe gly gly lys leu ala ala thr leu ser val 
123/41 153/51 

GCC GGT GAT ATA TTG GGT CAG ACG GGT ATG GCG GCG GCT GAG GTG ATC TGC GAC ACG CCG 
ala gly asp ile leu gly gin thr gly met ala ala ala glu val ile cys asp thr pro 
183/61 213/71 

CCG CGG TGC TCG AGC CAG GCT TAC GAC CAG GGA ATT TCG AAA ATG TTA TTC AGA ACA TCT 
pro arg cys ser ser gin ala tyr asp gin gly ile ser lys met leu phe arg thr ser 
243/81 "" 273/91 

TGT ATC TCT TCT CCG TGC CAC CCC CTA GGT GTA GTG TTT TCG AGT ACC GGC AGA TCC CAG 
cys ile ser ser pro cys his pro leu gly val val phe ser ser thr gly arg ser gin 
303/101 



GTT CAC CAG GTC TCA CCA GAT C 
val his gin val ser pro asp 



SEQ ID N° 7C 
FIGURE 7C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



CTT TGC 


GTG 


ATG 


TCC AAT 


GGC 


leu cys 


val 


met 


ser 


asn 


gly 


61/21 












TAG TTT 


TCG 


CGA 


TGA CGC 


TCG 


AMB phe 


ser 


arg 


OPA 


arcr 


ser 


121/41 












AGC GAA 


CCG 


TCG 


ATT 


CCA 


TGG 


ser glu 


pro 


ser 


ile 




trp 


181/61 












CGT TCC 


TGG 


GTT 


CGA 


CAC 


CAT 


arg sec 


trp 


val 


arg 


his 


his 


241/81 












GCG TCT 


TGG 


CTG 


CCG 


CCC 


CAC 


ala ser 


trp 


leu 


pro 


pro 


his 


301/101 












CGC GAA 


ACG 


TCA 


CCG 


CGT 


TCG 


arg glu 


thr 


ser 


pro 


arg 


ser 


^£1 /I 91 












ACG GTC 


GGG 


CGC 


CAT 


CGA 


CGC 


thr val 


gly 


arg 


his 


arg 


arg 


421/141 












TCG GCG 


ACG 


ATC 








ser ala 


thr 


ile 








TTT GCG 


TGA 


TGT 


CCA 


ATG 


GCG 


phe ala 


OPA 


cys 


pro 


met 


ala 


62/21 












AGT TTT 


CGC 


GAT 


GAC 


GCT 


CGT 


ser phe 


arg 


asp 


asp 


ala 


arcj 


122/41 












GCG AAC 


CGT 


CGA 


TTC 


CAT 


GGG 


ala asn 


arg 


arg 


phe his 


gly 


182/61 












GTT CCT 


GGG 


TTC 


GAC 


ACC 


ATT 


val pro 




phe 


asp 


thr 


ile 


242/81 










CGT CTT 


GGC 


TGC 


CGC 


CCC 


ACT 


arg leu 


gly 


cys 


arg 


pro 


thr 


302/101 












GCG AAA 


CGT 


CAC 


CGC 


GTT 


CGG 


ala lys 


arg 


his 


arg 


val 


arg 


362/121 












CGG TCG 


GGC 


GCC 


ATC 


GAC 


GCC 


arg ser 


gly 


ala 


ile 


asp 


ala 


422/141 












CGG CGA 


CGA 


TC 








arg arg 


arg 











22/185 



31/11 

GAA AAC GAC GCC TTG TCA 
glu asn asp ala leu ser 
91/31 

TTC TGA CCG GAC TTG TGA 
phe OPA pro asp leu OPA 
151/51 

GTG TCG ACG CAT TCG TGG 
val ser thr his ser trp 

211/71 
TCG CCC AAA TCG ACC TGC 
ser pro lys ser thr cys 

271/91 

TAG CGA CTG CGC CGT CGA 
AMB arg leu arg arg arg 

331/111 
GGG CAC CAG AGC ACG GAC 
gly his gin ser thr asp 

391/131 
CGG ACG AGG TCG CGG TGT 
arg thr arg ser arg cys 



SEQ ID N° 8A 
FIGURE 8A 









32/11 




AAA ACG 


ACG 


CCT TGT 


CAT 


lys 


thr 


thr 


pro cys 


his 








92/31 




TCT 


GAC 


CGG 


ACT TGT 


GAA 


ser 


asp 


arg 


thr cys 


glu 








152/51 




TGT 


CGA 


CGC 


ATT CGT 


GGT 


cys 


arg 


arg 


ile arg 


gly 








212/71 




CGC 


CCA 


AAT 


CGA CCT 


GCC 


arg 


pro 


asn 


arg pro 


ala 








272/91 




AGC 


GAC 


TGC 


GCC GTC 


GAC 


ser 


asp 


cys 


ala val 


asp 








332/111 




GGC 


ACC 


AGA 


GCA CGG 


ACC 


gly 


thr 


arg 


ala arg 


thr 








392/131 




GGA 


CGA 


GGT 


CGC GGT 


GTC 


gly arg 


gly 


arg gly 


val 



SEQ ID N° 8B 



TCG 
ser 


CAA 
gin 


TCG 
ser 


TCA 

ser 


GCA 
ala 


CCG 
pro 


GCC 
ala 


ACG GGT 
thr gly 


TTC GGG 
phe gly 


TCG 
ser 


AGG 
arg 


CCG 
pro 


TCA AGG 
ser arg 


CCG 
pro 


GCG 
ala 


CGG 
arg 


CAG GAC 
gin asp 


CCC 
pro 


AGG 
arg 


TTG 
leu 


CTC 
leu 


GTG 
val 


CGC 
arg 


CTG 
leu 


CGA 
arg 


TCC 
ser 


GGC 
gly 


AGG 
arg 


GCA 
ala 


CGT CAG 
arg gin 


CCG 
pro 


GCA 
ala 


TGC 
cys 


CGC 
arg 


GGG 
gly 


TCT 
ser 


CGG 
arg 


CGA 
arg 


GCA 
ala 


CGC 
arg 


TGG 
trp 


GCC 
ala 


GAA ACC 
glu thr 


CGC 
arg 


AAT 
asn 


CGT 
arg 


CAG 
gin 


CAC 
his 


CGG 
arg 


CCT 
pro 


CGG 
arg 


GTT 
val 


TCG GGT 

ser gly 


CGA 
arg 


GGC CGA 
gly arg 


CAA 
gin 


GGC 
gly 


CGG 
arg 


CGC 
arg 


GGC 
gly 


AGG 
arg 


ACC 
thr 


CCA 
pro 


GGT 
gly 


TGC 
cys 


TCG 
ser 


TGC 
Cys 


GCC 
ala 


TGG 

trp 


GAT 
asp 


CCG 
pro 


GCA 
ala 


GGG 
gly 


CAC 
his 


GTC 
val 


AGC 

ser 


CGG 
arg 


CAT 
his 


GCC 
ala 


GCG 
ala 


GGT 
gly 


CTC GGA 
leu gly 


GAG CAC 
glu his 


GCT GGG 
ala gly 


CCG 
pro 


AAA 
lys 


CCT 
pro 



FEUILLE DE REMF$£££j§Et& (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



23/185 



33/11 

TTG CGT GAT GTC CAA TGG CGA AAA CGA CGC CTT GTC ATC GCA ATC GTC AGC ACC GGC CTA 
leu arg asp val gin trp arg lys arg arg leu val ile ala ile val ser thr gly leu 
63/21 93/31 

GTT TTC GCG ATG ACG CTC GTT CTG ACC GGA CTT GTG AAC GGG TTT CGG GTC GAG GCC GAG 
val phe ala met thr leu val leu thr gly leu val asn gly phe arg val glu ala glu 
123/41 153/51 

CGA ACC GTC GAT TCC ATG GGT GTC GAC GCA TTC GTG GTC AAG GCC GGC GCG GCA GGA CCG 
arg thr val asp ser met gly val asp ala phe val val lys ala gly ala ala gly pro 
183/61 213/71 

TTC CTG GGT TCG ACA CCA TTC GCC CAA ATC GAC CTG CCC CAG GTT GCT CGT GCG CCT GGC 
phe leu gly ser thr pro phe ala gin ile asp leu pro gin val ala arg ala pro gly 
243/81 273/91 

GTC TTG GCT GCC GCC CCA CTA GCG ACT GCG CCG TCG ACG ATC CGG CAG GGC ACG TCA GCG 
val leu ala ala ala pro leu ala thr ala pro ser thr ile arg gin gly thr ser ala 
303/101 333/111 

CGA AAC GTC ACC GCG TTC GGG GCA CCA GAG CAC GGA CCC GGC ATG CCG CGG GTC TCG GAC 
arg asn val thr ala phe gly ala pro glu his gly pro gly met pro arg val ser asp 
363/121 393/131 

GGT CGG GCG CCA TCG ACG CCG GAC GAG GTC GCG GTG TCG AGC ACG CTG GGC CGA AAC CTC 

gly arg ala pro ser thr pro asp glu val ala val ser ser thr leu gly arg asn leu 

423/141 

GGC GAC GAT C 

gly asp asp 

SEQ ID N° 8C 
FIGURE 8C 



partie de la sequence nucleotidique de seq8A 
1/1 31/11 

CAG GTT GCT CGT GCG CCT GGC GTC TTG GCT GCC GCC CCA CTA GCG ACT GCG CCG TCG ACG 
gin val ala arg ala pro gly val leu ala ala ala pro leu ala thr ala pro ser thr 
61/21 91/31 

ATC CGG CAG GGC ACG TCA GCG CGA AAC GTC ACC GCG TTC GGG GCA CCA GAG CAC GGA CCC 
ile arg gin gly thr ser ala arg asn val thr ala phe gly ala pro glu his gly pro 
121/41 151/51 

GGC ATG CCG CGG GTC TCG GAC GGT CGG GCG CCA TCG ACG CCG GAC GAG GTC GCG GTG TCG 
gly met pro arg val ser asp gly arg ala pro ser thr pro asp glu val ala val ser 
181/61 

AGC ACG CTG GGC CGA AAC CTC GGC GAC GAT C 
ser thr leu gly atg asn leu gly asp asp 



SEQ ID N° 8A' 
FIGURE 8A' 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



24/185 



1/1 












31/11 














AGG TTG CTC GTG 


CGC 


CTG 


GCG 


TCT TGG 


CTG 


CCG CCC 


CAC 


TAG 


CGA CTG 


CGC CGT CGA 


CGA 


arg leu leu val 


arg 


leu 


ala 


ser trp 


leu 


pro pro 


his 


AMB 


arg 


leu 


arg arg arg 


arg 


61/21 












91/31 














TCC GGC AGG GCA 


CGT 


CAG 


CGC 


GAA ACG 


TCA 


CCG CGT 


TCG 


GGG 


CAC 


CAG 


AGC ACG GAC 


CCG 


ser gly arg ala 


arg gin 


arg glu thr 


ser 


pro arg 


ser 


gly his 


gin ser thr asp pro 


121/41 












151/51 














GCA TGC CGC GGG 


TCT 


CGG 


ACG 


GTC GGG 


CGC 


CAT CGA 


CGC 


CGG 


ACG 


AGG 


TCG CGG TGT 


CGA 


ala cys arg gly 


ser 


arg 


thr 


val gly 


arg 


his arg 


arg 


arg 


thr 


arg 


ser arg cys 


arg 


181/61 


























GCA CGC TGG GCC 


GAA 


ACC 


TCG 


GCG ACG 


ATC 
















ala arg trp ala 


glu 


thr 


ser 


ala thr 


ile 

















SEQ ID K° 8B' 



FIGURE 8B' 



SeqBC 

1/1 31/11 

CCA GGT TGC TCG TGC GCC TGG CGT CTT GGC TGC CGC CCC ACT AGC GAC TGC GCC GTC GAC 
pro gly cys ser cys ala trp arg leu gly cys arg pro thr ser asp cys ala val asp 
61/21 ~ 91/31 

GAT CCG GCA GGG CAC GTC AGC GCG AAA CGT CAC CGC GTT CGG GGC ACC AGA GCA CGG ACC 
asp pro ala gly his val ser ala lys arg his arg val arg gly thr arg ala arg thr 
121/41 151/51 

CGG CAT GCC GCG GGT CTC GGA CGG TCG GGC GCC ATC GAC GCC GGA CGA GGT CGC GGT GTC 
arg his ala ala gly leu gly arg ser gly ala ile asp ala gly arg gly arg gly val 
181/61 

GAG CAC GCT GGG CCG AAA CCT CGG CGA CGA TC 
glu his ala gly pro lys pro arg arg arg 

SEQ ID N° 8C 



FIGURE BC 1 



FEUILLE DE REMPLACEMENT (RE6LE 26) 



WO 99/09186 PCT/FR98/01813 

25/185 



sequence Rv2563 


pre< 


atg 








met 








121/41 








ctt ttt 


gcg 


get 


ttg 


leu phe 


ala 


ala 


leu 


181/61 








age acc 


ggc 


eta 


gtt 


ser thr 


gly 


leu 


val 


241/81 








gtc gag 


gee 


gag 


cga 


val glu 


ala 


glu 


arg 


301/101 








gcg gca 


gga 


ccg 


ttc 


ala ala 


gly 


pro 


phe 


361/121 








cgt gcg 


cct 


ggc 


gtc 


arg ala 


pro 


giy 


val 


421/141 








ggc acg 


tea 


gcg 


cga 


gly thr 


ser 


ala 


arg 


481/161 








egg gtc 


teg 


gac 


ggt 


arg val 


ser 


asp 


gly 


541/181 








ggc cga 


aac 


etc 


ggc 


gly arg 


asn 


leu 


gly 


601/201 








gtg ccc 


gag 


tea 


acc 


val pro 


glu 


ser 


thr 


661/221 








cag cag 


ttg 


gca 


tac 


gin gin 


leu 


ala 


tyr 


721/241 








cga cag 


etc 


ccg 


gac 


arg gin 


leu 


pro 


asp 


781/261 








cgc ccg 


ttg 


aag 


gtc 


arg pro 


leu 


lys 


val 


841/281 








gcg gcg 


ttg 


ate 


gtc 


ala ala 


leu 


ile 


val 


901/301 








gcg gtg 


ttc 


aag 


gcg 


ala val 


phe 


lys 


ala 


961/321 








gcg gtc 


gtc 


gtc 


gcg 


ala val 


val 


val 


ala 


1021/341 






ccg ttg 


ttc 


ccg 


atg 


pro leu phe 


pro 


met 


1081/361 






gcg act 


gtg 


ate 


ggt 


ala thr 


val 


ile 


gly 


1141/381 




ccg gca 


eta 


gcg 


ttc 


pro ala 


leu 


ala 


phe 



par Cole et al. 



cgt gat gtc caa tgg 
arg asp val gin trp 

ttc gcg atg acg etc 
phe ala met thr leu 

acc gtc gat tec atg 
thr val asp ser met 

ctg ggt teg aca cca 
leu gly ser thr pro 

ttg get gee gec cca 
leu ala ala ala pro 

aac gtc acc gcg ttc 
asn val thr ala phe 

c gg g c 9 cca teg acg 
arg ala pro ser thr 

gac gat ctg caa gtg 
asp asp leu gin val 

gcg ctg gca aag att 
ala leu ala lys ile 

aac gga cag ccg aca 
asn gly gin pro thr 

ggc tat cag acc gtc 
gly tyr gin thr val 

gcg gtg gat gcg ate 
ala val asp ala ile 

ggc teg gtg gtc tac 
gly ser val val tyr 

ate ggc gtg ccg acg 
ile gly val pro thr 

ctg etc gcg gcg gtg 
leu leu ala ala val 

act gtc gtg gta ccc 
thr val val val pro 

ctg ctg gec age gtc 
leu leu ala ser val 

gga ggt ccc tag 
gly gly pro AM3 

SEQ II 



(Nature 


393:537- 


-544 1 


151/51 








cga aaa 


cga 


cgc 


ctt 


arg lys 


arg 


arg 


leu 


211/71 








gtt ctg 


acc 


gga 


ctt 


val leu 


the 


gly 


leu 


271/91 








ggt gtc 


gac 


gca 


ttc 


gly val 


asp 


ala 


phe 


331/111 








ttc gec 


caa 


ate 


gac 


phe ala 


gin 


ile 


aso 


391/131 








eta aca 


act 


gcg 


ccg 


leu ala 


thr 


ala 


It 


451/151 






aaa aca 


cca 


gag 


cac 


alv ala 


pro 


glu 


his 


511/171 








ccg gac 


gag 


gtc 


gcg 


pro asp 


glu 


val 


ala 


571/191 








gqt qca 


cgc 


act 


tta 


gly ala 


arg 


thr 


leu 


631/211 








ccc aac 


ate 


ttc 


ctg 


pro asn 


ile 


phe 


leu 


691/231 








ate agt 


teg 


ate 


ctcici 

yyy 


ile ser 


ser 


ile 


alv 


751/251 






aat cga 


gcg 


gac 


get 


asn arg 


ala 


asp 


ala 


811/271 








acg gtt 


gtg 


gcg 


gtc 


thr val 


val 


ala 


val 


871/291 








etc tct 


gcg 


ttg 


aaa 


leu ser 


ala 


leu 


glu 


931/311 






cgc teg 


att 


ctg 


acc 


arg ser 


ile 


leu 


ala 


991/331 








gtt ggc 


ggc 


ate 


ctt 


val gly gly 


ile 


leu 


1051/351 






ctg agt 


gec 


ttc 


gtg 


leu ser 


ala 


phe 


val 


1111/371 






gca gga 


ctg 


egg 


cgc 


ala gly 


leu 


arg 


arg 



N° 8D 



et contenant seq8A' 



gtc ate gca ate gtc 
val ile ala ile val 

gtg aac ggg ttt egg 
val asn gly phe arg 

gtg gtc aag gec ggc 
val val lys ala gly 

ctg ccc cag gtt get 
leu pro gin val ala 

teg acg ate egg cag 
ser thr ile arg gin 

gga ccc ggc atg ccg 
gly pro gly met pro 

gtg teg age acg ctg 
val ser ser thr leu 

egg ate gtc ggc ate 
arg ile val gly ile 

acc acc gaa ggc eta 
thr thr glu gly leu 

ate gac ggg atg ccc 
ile asp gly met pro 

gtc age gat ctg atg 
val ser asp leu met 

ttg ctg tgg ate gtt 
leu leu trp ile val 

egg ctg cgt gac ttt 
arg leu arg asp phe 

ggg ctg gcg ctg cag 
gly leu ala leu gin 

teg ctg ctg ttg gcg 
ser leu leu leu ala 

gcg era ccg gcg ate 
ala leu pro ala ile 

gtg gtg gcg ate gat 
val val ala ile asp 



FEUILLE DE REM«5«S®HE«¥ (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



ORF predite 


par 


Cole et 


1/1 








tag gtt tea 


aga 


agg 


cct 


amb val ser 


arg 


arg 


pro 


61/21 








ccg ccg aaa 


tgg 


get 


aat 


pro pro lys 


trp 


ala 


asn 


121/41 








acc gac ccc 


etc 


acc 


teg 


thr asp pro 


leu 


thr 


ser 


181/61 








cat ttg att 


ggg 


tec 


acg 


hl3 leu ile 


gly 


ser 


thr 


241/81 








gat gtc caa 


tgg 


cga 


aaa 


asp val gin 


trp 


arig 


lys 


301/101 








gcg atg acg 


etc 


gtt 


ctg 


ala met thr 


leu 


val 


leu 


361/121 








gtc gat tec 


atg 


ggt 


gtc 


val asp ser 


met 


giy 


val 


421/141 






ggt teg aca 


cca 


ttc 


gee 


gly ser thr 


pro 


phe 


ala 


481/161 








get gec gec 


cca 


eta 


gcg 


ala ala ala 


pro 


leu 


ala 


541/181 








gtc acc gcg 


ttc 


ggg 


gca 


val thr ala 


phe 




ala 


601/201 








gcg cca teg 


acg 


ccg 


gac 


ala pro ser 


thr 


pro 


asp 


661/221 








gat ctg caa 


gtg 


ggt 


gcg 


asp leu gin 


val 


gly 


ala 


721/241 








ctg gca aag 


att 


ccc 


aac 


leu ala ly3 


ile 


pro 


asn 


781/261 








gga cag ecg 


aca 


ate 


agt 


gly gin pro 


thr 


ile 


ser 


841/281 








tat cag acc 


gtc 


aat 


cga 


tyr gin thr 


val 


asn 


arg 


901/301 








gtg gat gcg 


ate 


acg 


gtt 


val asp ala 


ile 


thr 


val 


961/321 








teg gtg gtc 


tac 


etc 


tct 


ser val val 


tyr 


leu 


ser 


1021/341 








ggc gtg ecg 


acg 


cgc 


teg 


gly val pro 


thr 


arg 


ser 


1081/361 








etc gcg gcg 


gtg 


gtt 


ggc 


leu ala ala 


val 


val 


gly 


1141/381 






gtc gtg gta 


ccc 


ctg 


agt 


val val val 


pro 


leu 


ser 


1201/401 








ctg gec age 


gtc 


gca 


gga 


leu ala ser 


val 


ala 


gly 


1261/421 








ggt ccc tag 








gly pro AMB 









26/185 





(Nature 


393:537-544) et 








31/11 


gtg 


cag 


gtt 


tec gca gee tgg 


val 


gin 


val 


ser ala ala trp 








91/31 


egg 


gtt 


cgc 


ttg get cga teg 


arg 


val 


arg 


leu ala arg ser 








151/51 


gtc 


gaa 


cct 


egg cga acc aac 


val 


glu 


pro 


arg arg thr asn 








211/71 


gaa 


gca 


ggt 


age ttc cgt cgc 


glu 


ala 


gly 


ser phe arg arg 








271/91 


cga 


cgc 


ctt 


gtc ate gca ate 


arg 


arg 


leu 


val ile ala ile 








331/111 


acc 


gga 


ctt 


gtg aac ggg ttt 


thr 


gly 


leu 


val asn gly phe 








391/131 


gac 


gca 


ttc 


gtg gtc aag gec 


asp 


ala 


phe 


val val lys ala 








451/151 


caa 


ate 


gac 


ctg ccc cag gtt 


gin 


ile 


asp 


leu pro gin val 








511/171 


act 


gcg 


ccg 


teg acg ate egg 


thr 


ala 


pro 


ser thr ile arg 








571/191 


cca 


gag 


cac 


gga ccc ggc atg 


pro 


glu 


his 


gly pro gly met 








631/211 


gag 


gtc 


gcg 


gtg teg age acg 


glu 


val 


ala 


val ser ser thr 








6917231 


cgc 


act 


ttg 


egg ate gtc ggc 


arg 


thr 


leu 


arg ile val gly 








751/251 


ate 


ttc 


ctg 


acc acc gaa ggc 


ile 


phe 


leu 


thr thr glu gly 








811/271 


teg 


ate 


ggg 


ate gac ggg atg 


ser 


ile 


gly 


ile asp gly met 








871/291 


gcg 


gat 


get 


gtc age gat ctg 


ala 


asp 


ala 


val ser asp leu 








931/311 


gtg 


gcg 


gtc 


ttg ctg tgg ate 


val 


ala 


val 


leu leu trp ile 








991/331 


gcg 


ttg 


gag 


egg ctg cgt gac 


ala 


leu 


glu 


arg leu arg asp 








1051/351 


att 


ctg 


gec 


ggg ctg gcg ctg 


ile 


leu 


ala 


gly leu ala leu 








1111/371 


ggc 


ate 


ctt 


teg ctg ctg ttg 


giy 


ile 


leu 


ser leu leu leu 








1171/391 


gec 


ttc 


gtg 


gcg eta ccg gcg 


ala 


phe 


val 


ala leu pro ala 








1231/411 


ctg 


egg 


cgc 


gtg gtg gcg ate 


leu 


arg 


arg 


val val ala ile 



SEQ ID N° 



contenant Rv2563 



gee 
ala 


gcg 
ala 


gcg 
ala 


cca 
pro 


ccg 
pro 


aag 
lys 


age 
ser 


ccg 
pro 


atg 
met 


ate 
ile 


teg 
ser 


ace 
thr 


gec 
ala 


acg 
thr 


gcg 
ala 


gca 
ala 


acg 
thr 


cca 
pro 


gec 
ala 


cat 
his 


gat 
asp 


atg 
met 


ctt 
leu 


ttt 
phe 


gcg 
ala 


get 
ala 


ttg 
leu 


cgt 
arg 


gtc 
val 


age 
ser 


acc 
thr 


ggc 
giy 


eta 
leu 


gtt 
val 


ttc 
phe 


egg 
arg 


gtc 
val 


gag 

glu 


gec 
ala 


gag 
glu 


cga 
arg 


acc 
thr 


ggc 
gly 


gcg 
ala 


gca 
ala 


gga 
gly 


ccg 
pro 


ttc 
phe 


ctg 
leu 


get 
ala 


cgt 
arg 


gcg 

ala 


cct 
pro 


ggc 
gly 


gtc 
val 


ttg 
leu 


cag 
gin 


ggc 

giy 


acg 
thr 


tea 

ser 


gcg 
ala 


cga 
arg 


aac 
asn 


ccg 
pro 


egg 
arg 


gtc 
val 


teg 

ser 


gac 
asp 


ggt 
gly 


egg 

arg 


ctg 
leu 


ggc 

gly 


cga 
arg 


aac 
asn 


etc 
leu 


ggc 

gly 


gac 
asp 


ate 
ile 


gtg 
val 


ccc 
pro 


gag 
glu 


tea 
ser 


acc 
thr 


gcg 
ala 


eta 
leu 


cag 
gin 


cag 
gin 


ttg 
leu 


gca 
ala 


tac 
tyr 


aac 
asn 


ccc 
pro 


cga 
arg 


cag 
gin 


etc 
leu 


ccg 
pro 


gac 
asp 


ggc 
gly 


atg 
met 


cgc 
arg 


ccg 
pro 


ttg 
leu 


aag 
lys 


gtc 
val 


gcg 
ala 


gtt 
val 


gcg 
ala 


gcg 
ala 


ttg 
leu 


ate 
ile 


gtc 
val 


ggc 
gly 


ttt 
phe 


gcg 
ala 


gtg 
val 


ttc 
phe 


aag 
lys 


gcg 
ala 


ate 
ile 


cag 
gin 


gcg 
ala 


gtc 
val 


gtc 
val 


gtc 
val 


gcg 
ala 


ctg 
leu 


gcg 
ala 


ccg 
pro 


ttg 
leu 


ttc 
phe 


ccg 
pro 


atg 
met 


act 

thr 


ate 
ile 


gcg 

ala 


act 
thr 


gtg 
val 


ate 
ile 


ggt 
gly 


ctg 
leu 


gat 

asp 


ccg 
pro 


gca 
ala 


eta 
leu 


gcg 

ala 


ttc 
phe 


gga 

giy 



FEUILLE DE REMPOftEfflEtiT (RE6LE 26) 



WO 99/09186 



PCT/FR98/01813 



27/165 



sequence de Rv0072 predite par par Cole et al. (Nature 393:537-544) et 
presentant plus de 77% de similarity avec Seq8D" 
1/1 31/11 

atg etc ttc gcg gec ctg cgt gac atg caa tgg aga aag cgc cgc ctg gtc ate acg ate 
Met leu phe ala ala leu arg asp met gin trp arg lys arg arg leu val ile thr ile 
61/21 91/31 

ate age acc ggg ctg ate ttc ggg atg acg ctt gtt ttg acc gga etc gcg aac ggc ttc 
ile ser thr gly leu ile phe gly met thr leu val leu thr gly leu ala asn gly phe 
121/41 151/51 

egg gtg gag gee egg cac acc gtc gat tec atg ggt gtc gat gta ttc gtc gte aga tec 
arg val glu ala arg his thr val asp ser met gly val asp val phe val val arg ser 
181/61 211/71 

ggc get get gga cct ttt ctg ggt tea ata ccg ttt ccc gat gtt gac ctg gec cga gtg 
gly ala ala gly pro phe leu gly ser ile pro phe pro asp val asp leu ala arg val 
241/81 271/91 

gec get gaa ccc ggt gtc atg gec gcg gec ccg ttg ggc age gtg ggg acg ate atg aaa 
ala ala glu pro gly val met ala ala ala pro leu gly ser val gly thr ile met lys 
301/101 331/111 

gaa gge acg teg acg cga aac gtc acg gtc ttc ggc gcg cec gag cac gga cct ggc atg 
glu gly thr ser thr arg asn val thr val phe gly ala pro glu his gly pro gly met 
361/121 391/131 

cca egg gtc tea gag ggt egg tea ccg teg aaa ccg gac gaa gtc gcg gca teg age acg 
pro arg val ser glu gly arg ser pro ser lys pro asp glu val ala ala ser ser thr 
421/141 451/151 

atg ggc cga cac etc ggt gac act gtc gag gtc ggc gcg cgc aga ttg egg gtc gtt ggc 
met gly arg his leu gly asp thr val glu val gly ala arg arg leu arg val val gly 
481/161 511/171 

att gtg ccg aat tec acc gcg ctg gec aag ate ccc aat gtc ttc etc acg acc gag ggc 
ile val pro asn ser thr ala leu ala lys ile pro asn val phe leu thr thr glu gly 
541/181 . 571/191 

tta cag aaa ttg gcg tac aac ggg cag ccg aat ate acg tec ate ggg ate ata ggt atg 
leu gin lys leu ala tyr asn gly gin pro asn ile thr ser ile gly ile ile gly met 
601/201 631/211 

ccc cga cag ctg ccg gag ggt tac cag act ttc gat egg gtg ggc get gtc aat gat ttg 
pro arg gin leu pro glu gly tyr gin thr phe asp arg val gly ala val asn asp leu 
661/221 691/231 

gtg cgc cca ttg aag gtc gca gtg aat teg ate teg ate gtg get gtt ttg ctg tgg att 
val arg pro leu lys val ala val asn ser ile ser ile val ala val leu leu trp ile 
721/241 751/251 

gtg gcg gtg ctg ate gtc ggc teg gtg gtg tac ctt teg get ctt gag egg eta cgt gac 
val ala val leu ile val gly ser val val tyr leu ser ala leu glu arg leu arg asp 
781/261 811/271 

ttc gcg gtg ttc aag gcg att ggc acg cca acg cgc teg att atg gee ggg etc gca tta 
phe ala val phe lys ala ile gly thr pro thr arg ser ile met ala gly leu ala leu 
841/281 871/291 

cag gcg ctg gtc att gcg ttg ctt gcg gcg gtg gtg ggc gtc gtc ctg gcg cag gtg ttg 
gin ala leu val ile ala leu leu ala ala val val gly val val leu ala gin val leu 
901/301 931/311 

gca cca ctg ttt ccg atg att gtc gcg gta ccc gtc ggt get tac ctg gcg eta ccg gtg 
ala pro leu phe pro met ile val ala val pro val gly ala tyr leu ala leu pro val 
961/321 991/331 

gee gcg ate gtc ate ggt ctg ttc get agt gtt gec gga ttg aag cgc gtg gtg acg gtc 
ala ala ile val ile gly leu phe ala ser val ala gly leu lys arg val val thr val 
1021/341 

gat ccc gcg cag gcg ttc gga ggt ccc tag 
asp pro ala gin ala phe gly gly pro AMB 

SEQ ID N° 8G 



FEUILLE DE REMPtMiNfcl*P(REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



28/185 



Seq8H i ORF predite par Cole et al. (Nature 393: 537-544) et contenant seq8G 
1/1 31/11 

tag cct ctg gga atg etc ttc gcg gcc ctg cgt gac atg caa tgg aga aag cgc cgc ctg 
AMB pro leu gly met leu phe ala ala leu arg asp met gin trp arg lys arg arg leu 
61/21 91/31 

gtc ate acg ate ate age ace ggg ctg ate ttc ggg atg acg ctt gtt ttg acc gga etc 
val ile thr ile ile ser thr gly leu ile phe gly met thr leu val leu thr gly leu 
121/41 151/51 

gcg aac ggc ttc egg gtg gag gcc egg cac acc gtc gat tec atg ggt gtc gat gta ttc 
ala asn gly phe arg val glu ala arg his thr val asp ser met gly val asp val phe 
181/61 211/71 

gtc gtc aga tec ggc get get gga cct ttt ctg ggt tea ata ccg ttt ccc gat gtt gac 
val val arg ser gly ala ala gly pro phe leu gly ser ile pro phe pro asp val asp 
241/81 271/91 

ctg gcc ega gtg gcc get gaa cce ggt gtc atg gcc gcg gcc ccg ttg ggc age gtg ggg 
leu ala arg val ala ala glu pro gly val met ala ala ala pro leu gly ser val gly 
301/101 331/111 

acg ate atg aaa gaa ggc acg teg acg ega aac gtc acg gtc ttc ggc gcg ccc gag cac 
thr ile met lys glu gly thr ser thr arg asn val thr val phe gly ala pro glu his 
361/121 391/131 

gga cct ggc atg cca egg gtc tea gag ggt egg tea ccg teg aaa ccg gac gaa gtc gcg 
gly pro gly met pro arg val ser glu gly arg ser pro ser lys pro asp glu val ala 
421/141 451/151 

gca teg age acg atg ggc ega cac etc ggt gac act gtc gag gtc ggc gcg cge aga ttg 
ala ser ser thr met gly arg his leu gly asp thr val glu val gly ala arg arg leu 
481/161 511/171 

egg gtc gtt ggc att gtg ccg aat tec acc gcg ctg gcc aag ate ccc aat gtc ttc etc 
arg val val gly ile val pro asn ser thr ala leu ala lys ile pro asn val phe leu 
541/181 . 571/191 

acg acc gag ggc tta cag aaa ttg geg tac aac ggg cag ccg aat ate acg tec ate ggg 
thr thr glu gly leu gin lys leu ala tyr asn gly gin pro asn ile thr ser ile gly 
601/201 631/211 

ate ata ggt atg ccc ega cag ctg ccg gag ggt tac cag act ttc gat egg gtg ggc get 
ile ile gly met pro arg gin leu pro glu gly tyr gin thr phe asp arg val gly ala 
661/221 691/231 

gtc aat gat ttg gtg cgc cca ttg aag gtc gca gtg aat teg ate teg ate gtg get gtt 
val asn asp leu val arg pro leu lys val ala val asn ser ile ser ile val ala val 
721/241 751/251 

ttg ctg tgg att gtg gcg gtg ctg ate gtc ggc teg gtg gtg tac ctt teg get ctt gag 
leu leu trp ile val ala val leu ile val gly ser val val tyr leu ser ala leu glu 
781/261 811/271 

egg eta cgt gac ttc gcg gtg ttc aag gcg att ggc acg cca acg cgc teg att atg gcc 
arg leu arg asp phe ala val phe lys ala ile gly thr pro thr arg ser ile met ala 
841/281 871/291 

ggg etc gca tta cag gcg ctg gtc att gcg ttg ctt gcg gcg gtg gtg ggc gtc gtc ctg 
gly leu ala leu gin ala leu val ile ala leu leu ala ala val val gly val val leu 
901/301 931/311 

gcg cag gtg ttg gca cca ctg ttt ccg atg att gtc gcg gta ccc gtc ggt get tac ctg 
ala gin val leu ala pro leu phe pro met ile val ala val pro val gly ala tyr leu 
961/321 991/331 

gcg eta ccg gtg gcc gcg ate gtc ate ggt ctg ttc get agt gtt gcc gga ttg aag cgc 

ala leu pro val ala ala ile val ile gly leu phe ala ser val ala gly leu lys arg 

1021/341 1051/351 

gtg gtg acg gtc gat ccc gcg cag gcg ttc gga ggt ccc tag 

val val thr val asp pro ala gin ala phe gly gly pro AMB 



SEQ ID N° 8H 
FEUILLE DE REMfl^RJEWlESV (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



29/185 



31/11 



CGA GGC CGA 


GCG AAC CGT 


CGA 


TTC 


CAT 


GGG 


TGT CGA 


CGC 


ATT 


CGT 


GGT 


CAA 


GGC 


CGG 


CGC 


arg gly arg 


ala asn arg 


arg phe his gly 


cys arg 


arcr 


ile 


qiy gin 


gxy 




w i. y 


61/21 












91/31 












GGC AGG ACC 


GTT CCT GGG 


TTC 


GAC 


ACC 


ATT 


CGC CCA 


AAT 


CGA 


CCT 


GCC 


CCA 


GGT 


TGC 


TCG 


gly arg thr 


val pro gly 


phe 


asp 


thr 


ile 


arg pro 


asn 


arg 


pro 


ala 


pro 


gly 


cys 


ser 


121/41 












151/51 












TGC GCC TGG 


CGT CTT GGC 


TGC 


CGC 


CCC 


ACT 


AGC GAC 


TGC 


GCC 


GTC 


GAC 


GAT 


CCG 


GCA 


GGG 


cys ala trp 


arg leu gly 


cys 


arg 


pro 


thr 


ser asp 


cys 


ala 


val 


asp 


asp 


pro 


ala 


giy 


181/61 












211/71 












CAC GTC AGC 


GCG AAA CGT 


CAC 


CGC 


GTT 


CGG 


GGC ACC 


AGA 


GCA 


CGG 


ACC 


CGG 


CAT 


GCC 


GCG 


his val ser 


ala lys arg 


his 


arg 


val 


arg 


gly thr 


arg 


ala 


arg 


thr 


arg 


his 


ala 


ala 


241/81 












271/91 














GGT CTC GGA 


CGG TCG GGC 


GCC 


ATC 


GAC 


GCC 


GGA CGA 


GGT 


CGC 


GGT 


GTC 


GAG 


CAC 


GCT 


GGG 


gly leu gly 


arg ser gly 


ala 


ile 


asp 


ala 


gly arg gly arg 


gly val glu 


his 


ala 


gly 



CCG AAA CCT CGG CGA CGA TC 
pro lys pro arg arg arg 

SEQ ID N* 9A 
FIGURE 9A 



* 32/11 



GAG GCC GAG 


CGA ACC 


GTC 


GAT 


TCC 


ATG 


GGT 


GTC GAC 


GCA 


TTC 


GTG GTC AAG 


GCC 


GGC 


GCG 


glu ala glu 


arg 


thr 


val 


asp 


ser 


met 


gly 


val asp 


ala 


phe 


val val lys 


ala 


gly 


ala 


62/21 
















92/31 










GCA GGA CCG 


TTC 


CTG 


GGT 


TCG 


ACA 


CCA 


TTC 


GCC CAA 


ATC 


GAC 


CTG CCC GAG 


GTT 


GCT 


CGT 


ala gly pro 


phe 


leu gly 


ser 


thr 


pro 


phe 


ala gin 


ile 


asp 


leu pro gin 


val 


ala 


arg 


122/41 
















152/51 












GCG CCT GGC 


GTC 


TTG 


GCT 


GCC 


GCC 


CCA 


CTA 


GCG ACT 


GCG 


CCG 


TCG ACG ATC 


CGG 


CAG 


GGC 


ala pro gly 


val 


leu 


ala 


ala 


ala 


pro 


leu 


ala thr 


ala 


pro 


ser thr ile 


arg 


gin 


gly 


182/61 
















212/71 








ACG TCA GCG 


CGA 


AAC 


GTC 


ACC 


GCG 


TTC 


GGG 


GCA CCA 


GAG 


CAC 


GGA CCC GGC 


ATG 


CCG 


CGG 


thr ser ala 


arg 


asn 


val 


thr ala phe 


giy 


ala pro 


glu his 


gly pro gly 


met 


pro 


arg 


242/81 
















272/91 










GTC TCG GAC 


GGT 


CGG 


GCG 


CCA 


TCG 


ACG 


CCG 


GAC GAG 


GTC 


GCG 


GTG TCG AGC 


ACG 


CTG 


GGC 


val ser asp 


gly arg ala 


pro 


ser 


thr 


pro 


asp glu 


val 


ala 


val ser ser 


thr 


leu 


gly 



302/101 
CGA AAC CTC GGC GAC GAT C 
arg asn leu gly asp asp 



SEQ ID N° 9B 
FIGURE 9B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



30/185 



33/11 



AGG CCG AGC GAA CCG 


TCG 


ATT 


CCA 


TGG 


GTG 


TCG ACG 


CAT 


TCG 


TGG 


TCA 


AGG 


CCG 


GCG 


CGG 


arg pro ser glu pro 


ser 


ile 


pro 


trp 


val 


ser thr 


his 


ser 


trp 


ser 


arg 


pro 


ala 


arg 


63/21 












93/31 












CAG GAC CGT TCC TGG 


GTT 


CGA CAC 


CAT 


TCG 


CCC AAA TCG ACC 


TGC 


CCC 


AGG 


TTG 


CTC 


GTG 


gin asp arg ser trp val 


arg 


his 


his 


ser 


pro lys 


ser 


thr 


cys 


pro 


arg 


leu 


leu 


val 


123/41 












153/51 












CGC CTG GCG TCT TGG 


CTG 


CCG 


CCC 


CAC 


TAG 


CGA CTG 


CGC 


CGT 


CGA 


CGA 


TCC 


GGC 


AGG 


GCA 


arg leu ala ser trp 


leu 


pro 


pro 


his 


AMB 


arg leu 


arg 


arg 


arg 


arg 


ser 


gly 


arg 


ala 


183/61 












213/71 










CGT CAG CGC GAA ACG 


TCA CCG 


CGT 


TCG 


GGG 


CAC CAG AGC ACG 


GAC 


CCG 


GCA 


TGC 


CGC 


GGG 


arg gin arg glu thr 


ser 


pro 


arg 


ser gly 


his gin 


ser 


thr 


asp 


pro 


ala 


cys 


arg 


gly 


243/81 












273/91 










TCT CGG ACG GTC GGG 


CGC 


CAT 


CGA 


CGC 


CGG 


ACG AGG 


TCG 


CGG 


TGT 


CGA 


GCA 


CGC 


TGG 


GCC 


ser arg thr val gly 


arg 


his 


arg 


arg 


arg 


thr arg 


ser 


arg 


cys 


arg 


ala 


arg 


trp 


ala 



GAA ACC TCG GCG ACG ATC 
glu thr. ser ala thr ile 

SEQ ID N° 9C 
FIGURE 9C 



TTA ACG ACT CAG ACG GAA ACG 
leu thr thr gin thr glu thr 
61/21 

GCT CTT TGG ,CAA TTG AAG GTG 
ala leu trp gin leu lys val 
121/41 

ATC AAT CGC CGG CTC GCG GAC 
ile asn arg arg leu ala asp 
181/61 

GGG TCC TTT GTG ACT GCC GGG 
gly ser phe val thr ala gly 
241/81 

CTA CCG TTC TGA CCT GGG GCT 
leu pro phe OPA pro gly ala 
301/101 

GGC CCA CCG CCA CCT CGG TCG 
gly pro pro pro pro arg ser 
361/121 

CTT GTT CGC ATC GTT GGT GTC 
leu val arg ile val gly val 
421/141 

GGC GGT CGT GCC GCG CAT GCG 
gly gly arg ala ala his ala 









31/11 




CTT 


GAA 


CCG 


CGA GGT CGC 


TCC 


leu 


glu 


pro 


arg gly arg 


ser 








91/31 




AGC 


TGC 


GAG 


CAG CCG GGT 


GAC 


ser 


cys 


glu 


gin pro gly 


asp 








151/51 




GTA 


GAT 


AAT 


CAG CTC ACC 


GTT 


val 


asp 


asn 


gin leu thr val 








211/71 




CTT 


GAC 


GCG 


GAC GAC CAC AGA 


leu 


asp 


ala 


asp asp his 


arg 








271/91 




GCG 


TGG 


GCG 


CCG ACG ACG TGA 


ala 


trp 


ala 


pro thr thr 


OPA 








331/111 




CCG 


GCA 


GTA 


TGT CAG CAT 


GTG 


pro 


ala 


val 


cys gin his 


val 








391/131 




GTG 


GTT 


GCG 


ACG ACC TTG 


GCG 


val 


val 


ala 


thr thr leu 


ala 



GAT C 
asp 



SEQ ID N° 10A 
FIGURE 10A 



GGA CAC 
gly his 


CAA 
gin 


TTT 
phe 


GAC 
asp 


TCG 
ser 


CGC ATC 
arg ile 


GTT 
val 


GGC 
gly 


CTT 
leu 


GCC 
ala 


GGG ACC 
gly thr 


GAC 
asp 


CTC 
leu 


GAC 
asp 


CAG 
gin 


GTC GGT 
val gly 


CAT 
his 


CGC 
arg 


CTA 

leu 


AGG 
arg 


GGC ACG 
gly thr 


TCA 
ser 


TGT 

cys 


CTC 
leu 


AGC 
ser 


CAG ATG 
gin met 


ACT 
thr 


CCA 
pro 


CGC 
arg 


AGC 

ser 


CTG GTG 
leu val 


AGC 
ser 


GCA 
ala 


CCC 
pro 


GCC 
ala 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCI7FR98/01813 



31/185 



32/11 

TM CGA CTC AGA CGG AAA CGC TTG AAC CGC GAG GTC GCT CCG GAC ACC AAT TTG ACT CGG 
OCH arg leu arg arg lys arg leu asn arg glu val ala pro asp thr asn leu thr arg 
62/21 ' 92/31 

CTC TTT GGC AAT TGA AGG TGA GCT GCG AGC AGC CGG GTG ACC GCA TCG TTG GCC TTG CCA 
leu phe gly asn OPA arg OPA ala ala ser ser arg val thr ala 3er leu ala leu pro 
122/41 152/51 

TCA ATC GCC GGC TCG CGG ACG TAG ATA ATC AGC TCA CCG TTG GGA CCG ACC TCG ACC AGG 
ser lie ala gly ser arg thr AMB ile ile ser ser pro leu gly pro thr ser thr arg 
182/61 212/71 

GGT CCT TTG TGA CTG CCG GGC TTG ACG CGG ACG ACC ACA GAG TCG GTC ATC GCC TAA GGC 
gly pro leu OPA leu pro gly leu thr arg thr thr thr glu ser val ile ala OCH gly 
242/81 272/91 

TAC CGT TCT GAC CTG GGG CTG CGT GGG CGC CGA CGA CGT GAG GCA CGT CAT GTC TCA GCG 
tyr arg ser asp leu gly leu arg gly arg arg arg arg glu ala arg his val ser ala 
302/101 332/111 

GCC CAC CGC GAC CTC GGT CGC CGG CAG TAT GTC AGC ATG TGC AGA TGA CTC CAC GCA GCC 
ala his arg his leu gly arg arg gin tyr val ser met cys arg OPA leu his ala ala 
362/121 392/131 

TTG TTC GCA TCG TTG GTG TCG TGG TTG CGA CGA CCT TGG CGC TGG TGA GCG CAC CCG CCG 
leu phe ala ser leu val ser trp leu arg arg pro trp arg trp OPA ala his pro pro 
422/141 

GCG GTC GTG CCG CGC ATG CGG ATC 
ala val val pro arg met arg Ile 

SEQ ID N° 10B 
FIGURE 10B 



33/11 

AAC GAC TCA GAC GGA AAC GCT TGA ACC GCG AGG TCG CTC CGG ACA CCA ATT TGA CTC GGC 
asn asp ser asp gly asn ala OPA thr ala arg ser leu arg thr pro ile OPA leu gly 
63/21 93/31 

TCT TTG GCA ATT GAA GGT GAG CTG CGA GCA GCC GGG TGA CCG CAT CGT TGG CCT TGC CAT 
ser leu ala ile glu gly glu leu arg ala ala gly OPA pro his arg trp pro cys his 
123/41 153/51 

CAA TCG CCG GCT CGC GGA CGT AGA TAA TCA GCT CAC CGT TGG GAC CGA CCT CGA CCA GGG 
gin ser pro ala arg gly arg arg OCH ser ala his arg trp asp arg pro arg pro gly 
183/61 213/71 

GTC CTT TGT GAC TGC CGG GCT TGA CGC GGA CGA CCA CAG AGT CGG TCA TCG CCT AAG GCT 
val leu cys asp cys arg ala OPA arg gly arg pro gin ser arg ser ser pro lys ala 
243/81 273/91 

ACC GTT CTG ACC TGG GGC TGC GTG GGC GCC GAC GAC GTG AGG CAC GTC ATG TCT CAG CGG 
thr val leu thr trp gly cys val gly ala asp asp val arg his val met ser gin arg 
303/101 333/111 

CCC ACC GCC ACC TCG GTC GCC GGC AGT ATG TCA GCA TGT GCA GAT GAC TCC ACG CAG CCT 
pro thr ala ,thr ser val ala gly ser met ser ala cys ala asp asp ser thr gin pro 
363/121 393/131 

TGT TCG CAT CGT TGG TGT CGT GGT TGC GAC GAC CTT GGC GCT GGT GAG CGC ACC CGC CGG 
cys ser his arg trp cys arg gly cys asp asp leu gly ala gly glu arg thr arg arg 
423/141 

CGG TCG TGC CGC GCA TGC GGA TC 
arg ser cys arg ala cys gly 

SEQ ID N° 10C 



FEUILLE DE REM^HlfilEWfiREGLE 26) 



WO 99/09186 



PCT/FR98/01813 



32/185 



31/11 

CCC GAA GAG GTC CCC CGT TTT GTT AAT TTT TAA AAA, ATT TGT GTC ACA AAC CGG GGT ACC 
pro glu glu val pro arg phe val asp phe OCH lys ile cys val thr lys arg gly thr 
61/21 91/31 

AAG GCA TAA AAC CTA GTA CCT GGG GCG GCG GAT TCA ACG AAA ACC GAG TGG CGG TAG TCA 
lys ala OCH asn leu val pro gly ala ala asp ser thr lys thr glu trp gly AMB ser 
121/41 151/51 

GGG GCG TGC ATT CCG ACG ACC CTG TAC GAC CCG CTG GTG GCA ACG CCG ATG AGT GCG CCG 
gly ala cys ile pro thr thr leu tyr asp pro leu val ala thr pro met ser ala pro 
181/61 211/71 

ACG AAG GCC GAG CGA CGG GCT GCC GGC GCT GAC CGC CGC GGA AGC CGC CGA GTG CAT GGT 
thr lys ala glu arg arg ala ala gly ala asp arg arg gly ser arg arg val asp gly 
241/81 271/91 

CAC CAC CGC CCG CAC CCG ACC GGT ACG GAT CGC GCC TCG GGT TAC CGT CGC CGT CAA CGC 
his his arg pro his pro thr gly thr asp arg ala ser gly tyr arg arg arg gin arq 
301/101 331/111 

GCT GGA CAG CAT CGG TCC CCG CTG GGT CAA TGC ACT CAT GCA GCG CCG CAA CGA ACA GCT 
ala gly gin his arg ser pro leu gly gin cys thr his ala ala pro gin arg thr ala 
361/121 391/131 * 

CAA CCC TTG AAC CGG GTC CCG GCC TGC CGA CCC TCG GCC GCC GGC GTG CCG CTA CGT GAT 
gin pro leu asn arg val pro ala cys arg pro ser ala ala gly val pro leu arg asp 
421/141 451/151 

AGA CAC AGG GCC ATG GAA ATC CTG GCC AGC CGG ATG CTA CTT CGG CCG GCG GAC TAT CAG 
arg his arg ala met glu ile leu ala ser arg met leu leu arg pro ala asp tyr qln 
481/161 

CGG TCG CTG AGC TTC TAC CGT GAC CAG ATC 
arg ser leu ser phe tyr arg asp gin ile 

SEQ ID N° HA 
FIGURE 11A 



32/11 

CCG AAG AGG TCC CCC GTT TTG TTA ATT TTT AAA AAA TTT GTG TCA CAA AGC GGG GTA CCA 
pro lys arg ser pro val leu leu ile phe lys lys phe val ser gin ser gly val pro 
62/21 92/31 

AGG CAT AAA ACC TAG TAC CTG GGG CGG CGG ATT CAA CGA AAA CCG AGT GGG GGT AGT CAG 
arg his lys thr AMB tyr leu gly arg arg ile gin arg lys pro aer gly gly ser gin 
122/41 152/51 

GGG CGT GCA TTC CGA CGA CCC TGT ACG ACC CGC TGG TGG CAA CGC CGA TGA GTG CCC CGA 
gly arg ala phe arg arg pro cys thr thr arg trp trp gin arg arg OPA val arg arg 
182/61 212/71 

CGA AGG CCG AGC GAC GGG CTG CCG GCG CTG ACC GCC GCG GAA GCC GCC GAG TGG ATG GTC 
arg arg pro ser asp gly leu pro ala leu thr ala ala glu ala ala glu trp met val 
242/81 272/91 

ACC ACC GCC CGC ACC CGA CCG GTA CGG ATC GCG CCT CGG GTT ACC GTC GCC GTC ACC GCG 
thr thr ala arg thr arg pro val arg ile ala pro arg val thr val ala val asn ala 
302/101 332/111 

CTG GAC AGC ATC GGT CCC CGC TGG GTC AAT GCA CTC ATG CAG CGC CGC AAC GAA CAG CTC 
leu asp ser ile gly pro arg trp val asn ala leu met gin arg arg asn glu gin leu 
362/121 392/131 

AAC CCT TGA ACC GGG TCC CGG CCT GCC GAC CCT CGG CCG CCG GCG TGC CGC TAC GTG ATA 
asn pro OPA thr gly ser arg pro ala asp pro arg pro pro ala cys arg tyr val ile 
422/141 452/151 

GAC ACA GGG CCA TGG AAA TCC TGG CCA GCC GGA TGC TAC TTC GCC CGG CGG ACT ATC AGC 
asp thr gly pro trp lys ser trp pro ala gly cys tyr phe gly arg arg tht ile ser 
482/161 

GGT CGC TGA GCT TCT ACC GTG ACC AGA TC 
gly arg OPA ala ser thr val thr arg 



SEQ ID N° 11B 



FIGURE 11B 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



33/185 



PCT/FR98/01813 



33/11 

CGA AGA GGT CCC CCG TTT TGT TAA TTT TTA AAA AAT TTG TQT CAC AAA GCG GGG TAG CAA 
arg arg gly pro pro phe cys OCH phe leu lys asn leu cys his lys ala gly tyr gin 
63/21 " 93/31 

GGC ATA AAA CCT AGT ACC TGG GGG GGC GGA TTC AAC GAA AAC CGA GTG GGG GTA GTC AGG 
gly ile lys pro ser thr trp gly gly gly phe asn glu asn arg val gly val val arg 
123/41 153/51 

GGG GTG CAT TCC GAG GAC CCT GTA CGA CCC GCT GGT GGC AAC GCC GAT GAG TGC GCC GAC 
gly val his ser asp asp pro val arg pro ala gly gly asn ala asp glu cys ala asp 
183/61 213/71 

GAA GGC CGA GCG ACG GGC TGC CGG CGC TGA CCG CCG CGG AAG CCG CCG AGT GGA TGG TCA 
glu gly arg ala thr gly cys arg arg OPA pro pro arg lys pro pro ser gly trp ser 
243/81 273/91 

CCA CCG CCC GCA CCC GAC CGG TAC GGA TCG CGC CTC GGG TTA CCG TCG CCG TCA ACG CGC 
pro pro pro ala pro asp arg tyr gly ser arg leu gly leu pro ser pro ser thr arg 
303/101 333/111 

TGG ACA GCA TCG GTC CCC GCT GGG TCA ATG CAC TCA TGC AGC GCC GCA ACG AAC AGC TCA 
trp thr ala ser val pro ala gly ser met his ser cys ser ala ala thr asn ser ser 
363/121 393/131 

ACC CTT GAA CCG GGT CCC GGC CTG CCG ACC CTC GGC CGC CGG CGT GCC GCT ACG TGA TAG 
thr leu glu pro gly pro gly leu pro thr leu gly arg arg arg ala ala thr OPA AMB 
423/141 453/151 

ACA CAG GGC CAT GGA AAT CCT GGC CAG CCG GAT GCT ACT TCG GCC GGC GGA CTA TCA GCG 
thr gin gly his gly asn pro gly gin pro asp ala thr ser ala gly gly leu ser ala 
483/161 

GTC GCT GAG CTT CTA CCG TGA CCA GAT C 
val ala glu leu leu pro OPA pro asp 

SEQ ID N° 11C 
FIGURE 11C 



partie de la sequence nucleotidique de Seqll 
1/1 31/11 

CGT CGC CGT CAA CGC GCT GGA CAG CAT CGG TCC CCG CTG GGT CAA TGC ACT CAT GCA GCG 
arg arg arg gin arg ala gly gin his arg ser pro leu gly gin cys thr his ala ala 
61/21 91/31 

CCG CAA CGA ACA GCT CAA CCC TTG AAC CGG GTC CCG GCC TGC CGA CCC TCG GCC GCC GGC 
pro gin arg thr ala gin pro leu asn arg val pro ala cys arg pro ser ala ala gly 
121/41 151/51 

GTG CCG CTA CGT GAT AGA CAC AGG GCC ATG GAA ATC CTG GCC AGC CGG ATG CTA CTT CGG 

val pro leu arg asp arg his arg ala met glu ile leu ala ser arg met leu leu arg 

181/61 - - - 211/71 

CCG GCG GAC TAT CAG CGG TCG CTG AGC TTC TAC CGT GAC CAG ATC 

pro ala asp tyr gin arg ser leu ser phe tyr arg asp gin ile 



SEQ ID N° 11A' 
FIGURE 11A 1 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



1/1 

GTC GCC GTC AAC GCG 
val ala val asn ala 
61/21 

CGC AAC GAA CAG CTC 
arg asn glu gin leu 
121/41 

TGC CGC TAC GTG ATA 
cy3 arg tyr val ile 
181/61 

CGG CGG ACT ATC AGC 
arg arg thr ile ser 



CTG GAC AGC ATC GGT 
leu a3p ser ile gly 

AAC CCT TGA ACC GGG 
a3n pro OFA thr gly 

GAC ACA GGG CCA TGG 
asp thr gly pro trp 

GGT CGC TGA GCT TCT 
gly arg OPA ala ser 



34/185 



Jl/lX 






ccc cnr 






pro arg 


trp 


val asn 


91/31 






TCC CGG 


CCT 


GCC GAC 


ser arg 


pro 


ala asp 


151/51 






AAA TCC 


TGG 


CCA GCC 


lys ser 


trp 


pro ala 


211/71 






ACC GTG 


ACC 


AGA TC 


thr val 


thr 


arg 



GCA CTC ATG CAG CGC 
ala leu met gin arg 

CCT CGG CCG CCG GCG 
pro arg pro pro ala 

GGA TGC TAC TTC GGC 
gly cys tyr phe gly 



SEQ ID N° 11B» 
FIGURE 11B' 



1/1 31/11 

TCG CCG TCA ACG CGC TGG ACA GCA TCG GTC CCC GCT GGG TCA ATG CAC TCA TGC AGC GCC 
ser pro ser thr arg trp thr ala ser val pro ala gly ser met his ser cy3 ser ala 
61/21 91/31 

GCA ACG AAC AGC TCA ACC CTT GAA CCG GGT CCC GGC CTG CCG ACC CTC GGC CGC CGG CGT 
ala thr asn ser ser thr leu glu pro gly pro gly leu pro thr leu gly arg arg arg 
121/41 151/51 

GCC GCT ACG TGA TAG ACA CAG GGC CAT GGA AAT CCT GGC CAG CCG GAT GCT ACT TCG GCC 

ala ala thr OPA AMB thr gin gly his gly asn pro gly gin pro asp ala thr ser ala 

181/61 211/71 

GGC GGA CTA TCA GCG GTC GCT GAG CTT CTA CCG TGA CCA GAT C 

gly gly leu ser ala val ala glu leu leu pro OPA pro asp 



SEQ ID N° 11C' 
FIGURE 11C 



sequence RvOS 4 6c prSdite par par Cole et al. (Nature 393:537-544) et contenant SeqllA' 
1/1 31/11 

atg gaa ate ctg gec age egg atg eta ctt egg ccg gcg gac tat cag egg teg ctg age 
Met glu ile leu ala ser arg met leu leu arg pro ala asp tyr gin arg ser leu ser 
61/21 91/31 

ttc tac cgt gac cag ate ggg ctg gcg att gee cgt gaa tac ggg gec ggc aca gtg ttt 
phe tyr arg asp gin ile gly leu ala ile ala arg glu tyr gly ala gly thr val phe 
121/41 151/51 

ttc gee ggt cag tea ctg etc gaa ctg gee ggt tac ggc gag ccg gac cat teg egg gga 
phe ala gly gin ser leu leu glu leu ala gly tyr gly glu pro asp his ser arg gly 
181/61 211/71 

cct ttt ccc ggc gcg ctg tgg ctg cag gtg cge gac etc gag get ace cag ace gag ctg 
pro phe pro gly ala leu trp leu gin val arg asp leu glu ala thr gin thr glu leu 
241/81 271/91 

gtc age cga ggc gtg teg ate get ege gag ccc cgc cgc gaa ccg tgg ggc ctg cac gag 
val ser arg gly val ser ile ala arg glu pro arg arg glu pro trp gly leu hi3 glu 
301/101 331/111 

atg cat gtg acc gac eca gac ggg ate aca ctg ata ttc gtc gag gtt ccc gag ggt cac 
met his val thr asp pro asp gly ile thr leu lie phe val glu val pro glu gly his 
361/121 

ccg ctg cgt aca gac acc egg gcg tga 
pro leu arg thr asp thr arg ala OPA 

SEQ ID N 9 11D 



FEUILLE DE REM6tpQ06§fi)ENfc(RE6LE 26) 



WO 99/09186 



PCT/FR98/01813 



35/185 



ORF predite par par Cole et 
1/1 

tag tea ggg cgt gca ttc gac 
AMB ser gly arg ala phe asp 
61/21 

gec gac gaa ggc eta cga egg 
ala asp glu gly leu arg arg 
121/41 

ggt cac cgc cgc ccg cac ccg 
gly his arg arg pro his pro 
181/61 

cgc get gga cag cat egg tec 
arg ala gly gin his arg ser 
241/81 

get caa ccc ttg aac egg gtc 
ala gin pro leu asn arg val 
301/101 

gat aga cac agg gee atg gaa 
asp arg his arg ala met glu 
361/121 

cag egg teg ctg age ttc tac 
gin arg ser leu ser phe tyr 
421/141 

gec ggc aca gtg ttt ttc gec 
ala gly thr val phe phe ala 
481/161 

gac cat teg egg gga cct ttt 
asp his ser arg gly pro phe 
541/181 

ace cag ace gag ctg gtc age 
thr gin thr glu leu val ser 
601/201 

tgg ggc ctg cac gag atg cat 
trp gly leu his glu met his 
661/221 

gtt ccc gag ggt cac ccg ctg 
val pro glu gly his pro leu 



al. (Nature 393:537-544) 
31/11 

gac get gta eta ccc get 
asp ala val leu pro ala 
91/31 

get gec ggc get gac cgc 
ala ala gly ala asp arg 
151/51 

acc ggt gcg gat cgc gec 
thr gly ala asp arg ala 

211/71 
ccg ctg ggt caa tgc act 
pro leu gly gin cys thr 

271/91 
ccg gee tgc cga ccc teg 
pro ala cys arg pro ser 

331/111 
ate ctg gec age egg atg 
ile leu ala ser arg met 

391/131 
cgt gac cag ate ggg ctg 
arg asp gin ile gly leu 

451/151 
ggt cag tea ctg etc gaa 
gly gin ser leu leu glu 

511/171 
ccc ggc gcg ctg tgg ctg 
pro gly ala leu trp leu 

571/191 
cga ggc gtg teg ate get 
arg gly val ser ile ala 

631/211 
gtg acc gac cca gac ggg 
val thr asp pro asp gly 

691/231 
cgt aca gac acc egg gcg 
arg thr asp thr arg ala 



SEQ ID N° 11F 
FIGURE 11F 



et contenant Rv0546c 



ggt ggc aac tec gat gat tgc 
gly gly asn ser asp asp cys 

cgc gga age cgc cga gtg gat 
arg gly ser arg arg val asp 

teg ggt tgc cgt cgc cgt caa 
ser gly cys arg arg arg gin 

cat gca gcg ccg caa cga aca 
his ala ala pro gin arg thr 

gee gec ggc gtg ccg eta cgt 
ala ala gly val pro leu arg 

eta ctt egg ccg gcg gac tat 
leu leu arg pro ala asp tyr 

gcg att gec cgt gaa tac ggg 
ala ile ala arg glu tyr gly 

ctg gec ggt tac ggc gag ccg 
leu ala gly tyr gly glu pro 

cag gtg cgc gac etc gag get 
gin val arg asp leu glu ala 

cgc gag ccc cgc cgc gaa ccg 
arg glu pro arg arg glu pro 

ate aca ctg ata ttc gtc gag 
ile thr leu ile phe val glu 

tga 
OPA 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PO7FR98/01813 



36/185 



1/1 

gac cga agg gat ttc gcg act 
asp arg arg asp phe ala thr 
61/21 

gac gta gac agg aag aga cag 
asp val asp arg lys arg gin 
121/41 

gag tct ttc cga gtt cag caa 
glu ser phe arg val gin gin 
181/61 

gcg gcc egg gec get teg ggc 
ala ala arg ala ala ser gly 
241/81 

gac aac cgc gcg gaa ttc aat 
asp asn arg ala glu phe asn 
301/101 

aac etc egg agt gat c 
asn leu arg ser asp . 









31/11 




aac 


teg 


gcc 


tgt aag 


gca 


asn 


ser 


ala 


cys lys 


ala 








91/31 




gga 


age 


tga 


tga cgt 


cgc 


gly 


ser 


OPA 


OPA arg 


arg 








151/51 




caa 


teg 


aca 


cag aag 


egg 


gin 


ser 


thr 


gin lys 


arg 








211/71 




cga gtg 


tct 


gag taa 


gac 


arg 


val 


ser 


glu OCH 


asp 








271/91 




<=gg 


atg 


gcg 


ggc ggg 


ace 


arg 


met 


ala 


gly gly 


the 



acg cga ggt ctt cat gcc gag 
thr arg gly leu his ala glu 

gta ccg gac cgc cat tct gtc 
val pro asp arg his ser val 

gga cca gac egg gag gac gac 
gly pro asp arg glu asp asp 

cag agt eac ggg tec gtg tgt 
gin ser his gly ser val cys 

gga ttg cgc egg tea ccg agg 
gly leu arg arg ser pro arg 



SEQ ID N° 12A 
FIGURE 12A 



1/1 " 31/11 

ace gaa ggg att teg cga eta act egg cct gta agg caa cgc gag gtc ttc atg ccg agg 
thr glu gly iie ser arg leu thr arg pro val arg gin acg glu val phe met pro arg 
61/21 91/31 

acg tag aca gga aga gac agg gaa get gat gac gtc gcg tac egg acc gcc att ctg teg 
thr AMB thr gly arg asp arg glu ala asp asp val ala tyr arg thr ala ile leu ser 
121/41 151/51 

agt ctt tec gag tta age aac aat cga cac aga age ggg gac cag acc ggg agg acg acg 
ser leu ser glu phe ser asn asn arg his arg ser gly asp gin thr gly arg thr thr 
181/61 211/71 

egg ccc ggg ccg ctt egg gcc gag tgt ctg agt aag acc aga gtc acg ggt ccg tgt gtg 
arg pro gly pro leu arg ala glu cys leu ser lys thr arg val thr gly pro cys val 
241/81 271/91 

aca acc gcg egg aat tea ate gga tgg egg gcg gga ccg gat tgc gcc ggt cac cga gga 
thr thr ala arg asn ser ile gly trp arg ala gly pro asp cys ala gly his arg gly 
301/101 

acc tec gga gtg ate 
thr ser gly val ile 



SEQ ID N° 12B 
FIGURE 12B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/018I3 



37/185 



1/1 31/11 

ccg aag gga ttt cgc gac taa etc ggc ctg taa ggc aac gcg agg tct tea tgc cga gga 
pro lys gly phe arg asp OCH leu gly leu OCH gly asn ala arg ser ser cys arg gly 
61/21 91/31 

egt aga cag gaa gag aca ggg aag ctg atg acg teg cgt acc gga ccg cca ttc tgt cga 
arg arg gin glu glu thr gly lys leu met thr ser arg thr gly pro pro phe cy3 arg 
121/41 151/51 

gtc ttt ccg agt tea gea aca ate gac aca gaa gcg ggg acc aga ccg gga gga cga cgc 
val phe pro ser sar ala thr ile asp thr glu ala gly thr arg pro gly gly arg arg 
181/61 211/71 

ggc ccg ggc cgc ttc ggg ccg agt gtc tga gta aga cca gag tea egg gtc cgt gtg tga 
gly pro gly arg phe gly pro ser val OPA val arg pro glu ser arg val arg val OPA 
241/81 271/91 

caa ccg cgc gga att caa teg gat ggc ggg egg gac egg att gcg ccg gtc acc gag gaa 
gin pro arg gly ile gin ser asp gly gly arg asp arg ile ala pro val thr glu glu 
301/101 

cct ccg gag tga tc 
pro pro glu OPA 

SEQ ID N° 12C 
FIGURE 12C 



1/1 31/11 

GGC ATT TCG TTG CCC GAT GGA TTG TTT GTA CGG TTT GGG AAA AAC ACT TGA AGT CCT TTT 
gly ile ser leu pro asp gly leu phe val arg phe gly lys asn thr OPA ser pro phe 
61/21 91/31 

TAT TGG CAA TGC TGG AAA TGG ACA TTC CAA TAT TGC GCG AAT TAA CCG AAC ACG GTG AGG 
tyr trp gin cys trp lys trp thr phe gin tyr cys ala asn OCH pro asn thr val arg 
121/41 151/51 

GGG GGG CAA GCG TTT GTA CCG GGG CCA GCA AGC GCC GCC GAC CGG TTG ACC GAA GCC AGC 
gly gly gin ala phe val pro gly pro ala ser ala ala asp arg leu thr glu ala ser 
181/61 211/71 

ATG TTG TTG TGT CAG CGC GGG CTT GGT CTC GAT GTC CCG GCC TTG GCT GGA CCC GCT TCT 
met leu leu cys gin arg gly leu gly leu asp val pro ala leu ala gly pro ala ser 
241/81 271/91 

TCA AAA CAG GTT GAA CTT AAC GAC TCA AGA ACG GAA ACG CTT GAA CCG CGA CGT CGC TCC 
ser lys gin val glu leu asn asp ser arg thr glu thr leu glu pro arg arg arg ser 
301/101 331/111 

GGA CAC CAA TTT GAC TCG GCT CTT TGG CAA TTG AAG GTG AGC TGC GAG CAG CCG GGT GAC 
gly his gin phe asp ser ala leu trp gin leu lys val ser cys glu gin pro gly asp 
361/121 391/131 

CGC ATC GTT GGC CTT GCC ATC AAT CGC CGG CTC GCG GAC GTA GAT AAT CAG CTC ACC GTT 
arg ile val gly leu ala ile asn arg arg leu ala asp val asp asn gin leu thr val 
421/141 451/151 

GGG ACC GAC CTC GAC CAG GGG TCC TTT GTG ACT GCC GGG CTT GAC GCG GAC GAC CAC AGA 
gly thr asp leu asp gin gly ser phe val thr ala gly leu asp ala asp asp his arg 
481/161 511/171 

GTC GGT CAT CGC CTA AGG CTA CCG TTC TGA CCT GGG GCT GCG TGG GCG CCG ACG ACG TGA 
val gly his arg leu arg leu pro phe OPA pro gly ala ala trp ala pro thr thr OPA 
541/181 571/191 

GGC ACG TCA TGT CTC AGC GGC CCA CCG CCA CCT CGG TCG CCG GCA GTA TGT CAG CAT GTG 
gly thr ser cys leu ser gly pro pro pro pro arg ser pro ala val cy3 gin his val 
601/201 J 631/211 

CAG ATG ACT CCA CGC AGC CTT GTT CGC ATC GTT GGT GTC GTG GTT GCG ACG ACC TTG GCG 

gin met thr pro arg 3er leu val arg ile val gly val val val ala thr thr leu ala 

661/221 691/231 

CTG GTG AGC GCA CCC GCC GGC GGT CGT GCC GCG CAT GCG GAT C 

leu val ser ala pro ala gly gly arg ala ala his ala asp 



SEQ ID N° 13A 



FIGURE 13A 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



38/185 



32/U 

GGA TTT CGT TGC GCG ATG GAT TGT TTG TAC GGT TTG GGA AAA ACA CTT GAA GTC CTT TTT 
gly phe arg cys pro met asp cys leu tyr gly leu gly lys thr leu glu val leu phe 
62/21 92/31 

ATT GGC AAT GCT GGA AAT GGA CAT TCC AAT ATT GCG CGA ATT AAC CGA ACA CGG TGA GGG 
ile gly asn ala gly asn gly his ser asn ile ala arg ile asn arg thr arg OPA gly 
122/41 152/51 

GGG GGC AAG CGT TTG TAC CGG GGC CAG CAA GCG CCG CCG ACC GGT TGA CCG AAG CCA GCA 
gly gly ly 3 ar 9 1® U tyr arg gly gin gin ala pro pro thr gly OPA pro lys pro ala 
182/61 " 212/71 

TGT TGT TGT GTC AGC GCG GGC TTG GTC TCG ATG TCC CGG CCT TGG CTG GAC CCG CTT CTT 
cys cys cys val ser ala gly leu val ser met ser arg pro trp leu asp pro leu leu 
242/81 272/91 

CAA AAC AGG TTG AAC TTA ACG ACT CAA GAA CGG AAA CGC TTG AAC CGC GAC GTC GCT CCG 
gin asn arg leu a3n leu thr thr gin glu arg lys arg leu asn arg asp val ala pro 
302/101 332/111 

GAC ACC AAT TTG ACT CGG CTC TTT GGC AAT TGA AGG TGA GCT GCG AGC AGC CGG GTG ACC 
asp thr asn leu thr arg leu phe gly asn OPA arg OPA ala ala ser ser arg val thr 
362/121 392/131 

GCA TCG TTG GCC TTG CCA TCA ATC GCC GGC TCG CGG ACG TAG ATA ATC AGC TCA CCG TTG 
ala ser leu ala leu pro ser ile ala gly ser arg thr AMB ile ile ser ser pro leu 
422/141 452/151 

GGA CCG ACC TCG ACC AGG GGT CCT TTG TGA CTG CCG GGC TTG ACG CGG ACG ACC ACA GAG 
gly pro thr ser thr arg gly pro leu OPA leu pro gly leu thr arg thr thr thr glu 
482/161 512/171 

TCG GTC ATC GCC TAA GGC TAC CGT TCT GAC CTG GGG CTG CGT GGG CGC CGA CGA CGT GAG 
ser val ile ala OCH gly tyr arg ser asp leu gly leu arg gly arg arg arg arg glu 
542/181 572/191 

GCA CGT CAT GTC TCA GCG GCC CAC CGC CAC CTC GGT CGC CGG CAG TAT GTC AGC ATG TGC 
ala arg his val ser ala ala his arg his leu gly arg arg gin tyr val ser met cys 
602/201 632/211 

AGA TGA CTC CAC GCA GCC TTG TTC GCA TCG TTG GTG TCG TGG TTG CGA CGA CCT TGG CGC 

arg OPA leu his ala ala leu phe ala ser leu val ser trp leu arg arg pro trp arg 

662/221 692/231 

TGG TGA GCG CAC CCG CCG GCG GTC GTG CCG CGC ATG CGG ATC 

trp OPA ala his pro pro ala val val pro arg met arg ile 

SEQ ID N° 13B 
FIGURE 13B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



39/185 



33/11 

GAT TTC GTT GCC CGA TGG ATT GTT TGT ACG GTT TGG GAA AAA CAC TTG AAG TCC TTT TTA 
asp phe val ala arg trp ile val cys thr val trp glu lys his leu lys ser phe leu 
63/21 93/31 

TTG GCA ATG CTG GAA ATG GAC ATT CCA ATA TTG CGC GAA TTA ACC GAA CAC GGT GAG GGG 
leu ala met leu glu met asp ile pro ile leu arg glu leu thr glu his gly glu gly 
123/41 153/51 

GGG GCA AGO GTT TGT ACC GGG GCC AGC AAG CGC CGC CGA CCG GTT GAC CGA AGC CAG CAT 
gly ala ser val cys thr gly ala ser lys arg arg arg pro val asp arg ser gin his 
183/61 213/71 

GTT GTT GTG TCA GCG CGG GCT TGG TCT CGA TGT CCC GGC CTT GGC TGG ACC CGC TTC TTC 
val val val ser ala arg ala trp ser arg cys pro gly leu gly trp thr arg phe phe 
243/81 273/91 

AAA ACA GGT TGA ACT TAA CGA CTC AAG AAC GGA AAC GCT TGA ACC GCG ACG TCG CTC CGG 
lys thr gly OPA thr OCH arg leu lys asn gly asn ala OPA thr ala thr ser leu arg 
303/101 333/111 

ACA CCA ATT TGA CTC GGC TCT TTG GCA ATT GAA GGT GAG CTG CGA GCA GCC GGG TGA CCG 
thr pro ile OPA leu gly ser leu ala ile glu gly glu leu arg ala ala gly OPA pro 
363/121 393/131 

CAT CGT TGG CCT TGC CAT CAA TCG CCG GCT CGC GGA CGT AGA TAA TCA GCT CAC CGT TGG 
his arg trp pro cys his gin ser pro ala arg gly arg arg OCH ser ala his arg trp 
423/141 453/151 

GAC CGA CCT CGA CCA GGG GTC CTT TGT GAC TGC CGG GCT TGA CGC GGA CGA CCA CAG AGT 
asp arg pro arg pro gly val leu cys asp cys arg ala OPA arg gly arg pro gin ser 
483/161 513/171 

CGG TCA TCG CCT AAG GCT ACC GTT CTG ACC TGG GGC TGC GTG GGC GCC GAC GAC GTG AGG 
arg ser ser pro lys ala thr val leu thr trp gly cys val gly ala asp asp vai arg 
543/181 . 573/191 

CAC GTC ATG TCT CAG CGG CCC ACC GCC ACC TCG GTC GCC GGC AGT ATG TCA GCA TGT GCA 
his val met ser gin arg pro thr ala thr ser val ala gly ser met ser ala cys ala 
603/201 633/211 

GAT GAC TCC ACG CAG CCT TGT TCG CAT CGT TGG TGT CGT GGT TGC GAC GAC CTT GGC GCT 

asp asp ser thr gin pro cys ser his arg trp cys arg gly cys asp asp leu gly ala 

663/221 693/231 

GGT GAG CGC ACC CGC CGG CGG TCG TGC CGC GCA TGC GGA TC 

gly glu arg thr arg arg arg ser cys arg ala cys gly 



SEQ ID N Q 13C 
FIGURE 13C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



40/185 



partie de la sequence nucleotidique de seq!3A 
1/1 31/11 

GGG TCC TTT GTG ACT GCC GGG CTT GAC GCG GAC GAC CAC AGA GTC GGT CAT CGC CTA AGG 
gly ser phe val thr ala gly leu asp ala asp a3p his arg val gly his arg leu arg 
61/21 91/31 

CTA CCG TTC TGA CCT GGG GCT GCG TGG GCG CCG ACG ACG TGA GGC ACG TCA TGT CTC AGC 
leu pro phe OPA pro gly ala ala trp ala pro thr thr OPA gly thr ser cys leu ser 
121/41 151/51 

GGC CCA CCG CCA CCT CGG TCG CCG GCA GTA TGT CAG CAT GTG CAG ATG ACT CCA CGC AGC 
gly pro pro pro pro arg ser pro ala val cys gin his val gin met thr pro arg ser 
181/61 211/71 

CTT GTT CGC ATC GTT GGT GTC GTG GTT GCG ACG ACC TTG GCG CTG GTG AGC GCA CCC GCC 
leu val arg ile val gly val val val ala thr thr leu ala leu val ser ala pro ala 
241/81 

GGC GGT CGT GCC GCG CAT GCG GAT C 
gly gly arg ala ala his ala asp 



SEQ ID K° 13A 1 
FIGURE 13A» 



1/1 31/11 

GGT CCT TTG TGA CTG CCG GGC TTG ACG CGG ACG ACC ACA GAG TCG GTC ATC GCC TAA GGC 
gly pro leu OPA leu pro gly leu thr arg thr thr thr glu ser val ile ala OCH gly 
61/21 91/31 

TAC CGT TCT GAC CTG GGG CTG CGT GGG CGC CGA CGA CGT GAG GCA CGT CAT GTC TCA GCG 
tyr arg ser asp leu gly leu arg gly arg arg arg arg glu ala arg his val ser ala 
121/41 151/51 

GCC CAC CGC CAC CTC GGT CGC CGG CAG TAT GTC AGC ATG TGC AGA TGA CTC CAC GCA GCC 
ala his arg his leu gly arg arg gin tyr val ser met cys arg OPA leu hi3 ala ala 
181/61 211/71 

TTG TTC GCA TCG TTG GTG TCG TGG TTG CGA CGA CCT TGG CGC TGG TGA GCG CAC CCG CCG 
leu phe ala ser leu val ser trp leu arg arg pro trp arg trp OPA ala his pro pro 
241/81 

GCG GTC GTG CCG CGC ATG CGG ATC 
ala val val pro arg met arg ile 



SEQ ID N° 13B' 
FIGURE 13B» 



1/1 31/11 

GTC CTT TGT GAC TGC CGG GCT TGA CGC GGA CGA CCA CAG AGT CGG TCA TCG CCT AAG GCT 
val leu cys asp cys arg ala OPA arg gly arg pro gin ser arg ser ser pro lys ala 
61/21 91/31 

ACC GTT CTG ACC TGG GGC TGC GTG GGC GCC GAC GAC GTG AGG CAC GTC ATG TCT CAG CGG 
thr val leu thr trp gly cys val gly ala asp asp val arg his val met ser gin arg 
121/41 151/51 

CCC ACC GCC ACC TCG GTC GCC GGC AGT ATG TCA GCA TGT GCA GAT GAC TCC ACG CAG CCT 
pro thr ala thr ser val ala gly ser met ser ala cys ala asp asp ser thr gin pro 
181/61 211/71 

TGT TCG CAT CGT TGG TGT CGT GGT TGC GAC GAC CTT GGC GCT GGT GAG CGC ACC CGC CGG 
cys ser his arg trp cys arg gly cys asp asp leu gly ala gly glu arg thr arg arg 
241/81 

CGG TCG TGC CGC GCA TGC GGA TC 
arg ser cys arg ala cys gly 

SEQ ID N° 13C 
FIGURE 13C 1 
FEUILLE DE (^EMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



41/185 



sequence Rvl984c predite par Cole et al. {Nature 393:537-544) et contenant 
seql3A' 

1/1 31/11 

atg act cca cgc age ctt gtt cgc ate gtt ggt gtc gtg gtt gcg acg acc ttg gcg etg 

Met thr pro arg ser leu val arg ile val gly val val val ala thr thr leu ala leu 
61/21 91/31 

gtg age gca ccc gec ggc ggt cgt gec gcg cat gcg gat ccg tgt teg gac ate gcg gtc 

val ser ala pro ala gly gly arg ala ala his ala asp pro cys ser asp ile ala val 
121/41 151/51 

gtt ttc get cgc ggc acg cat cag get tct ggt ctt ggc gac gtc ggt gag gcg ttc gtc 

val phe ala arg gly thr his gin ala ser gly leu gly asp val gly glu ala phe val 
181/61 211/71 

gac teg ctt acc teg caa gtt ggc ggg egg teg att ggg gtc tac gcg gtg aac tac cca 

asp ser leu thr ser gin val gly gly arg ser ile gly val tyr ala val asn tyr pro 
241/81 271/91 



gca age 
ala ser 
301/101 


gac 
asp 


gac 
asp 


tac 
tyr 


cgc 
arg 


gcg 
ala 


age 
ser 


ala 


tea 

ser 


aac ggt 
asn gly 
331/111 


tec 
ser 


gat 
asp 


gat 
asp 


gcg 
ala 


age 
ser 


gec 
ala 


cac 
his 


ate 
ile 


cag cgc 
gin arg 
361/121 


acc 
thr 


gtc 
val 


gec 
ala 


age 
ser 


tgc 
cys 


ccg 
pro 


aac 
asn 


acc 
thr 


agg att 
arg ile 
391/131 


gtg 
val 


ctt 
leu 


ggt 

gly 


ggc tat 
gly tyr 


teg 
ser 


cag 
gin 


ggt 

gly 


gcg acg 
ala thr 
421/141 


gtc 
val 


ate 
ile 


gat 
asp 


ttg 
leu 


tec 
ser 


acc 
thr 


teg 
ser 


gcg 
ala 


atg ccg 
met pro 
451/151 


ccc 
pro 


gcg 
ala 


gtg 

val 


gca 
ala 


gat 
asp 


cat 
his 


gtc 
val 


gec 
ala 


get gtc 
ala val 
481/161 


gee 
ala 


ctt 
leu 


ttc 
phe 


ggc 
gly 


gag 
glu 


cca 
pro 


tec 
ser 


agt 
ser 


ggt ttc 
gly phe 
511/171 


tec 
ser 


age 

ser 


atg 
met 


ttg tgg ggc ggc 
leu trp gly gly 


ggg 

gly 


teg ttg 
ser leu 
541/181 


ccg 
pro 


aca 
thr 


ate 
ile 


ggt 
gly 


ccg 
pro 


ctg 
leu 


tat 
tyr 


age 
ser 


tct aag 
ser lys 
571/191 


acc 
thr 


ata 
ile 


aac 
asn 


ttg 
leu 


tgt 
cys 


get 
ala 


ccc 
pro 


gac 
asp 


gat cca 
asp pro 
601/201 


ata 
ile 


tgc 
cys 


acc 
thr 


gga 
gly 


ggc 
gly 


ggc 
gly 


aat 
asn 


att 
ile 


atg gcg 
met ala 
631/211 


cat 
his 


gtt 
val 


teg 
ser 


tat 
tyr 


gtt 

val 


cag teg 
gin ser 


ggg 

gly 


atg aca 
met thr 


age 
ser 


cag 
gin 


gcg 
ala 


gcg 
ala 


aea 
thr 


ttc 
phe 


gcg 
ala 


gcg 
ala 


aac agg 
asn arg 


etc 
leu 


gat 
asp 


cac 
his 


gec 
ala 


gga tga 
gly OPA 







SEQ ID N° 13D 
FIGURE 13D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCIYFR98/0I813 



42/18S 



Seql3F: ORF predite par Cole et al. (Nature 393:537-544) et contenant Rvl984c 
1/1 31/11 

tga ggc acg tea tgt etc age ggc cca ccg cca cct egg teg ccg gca gta tgt cag cat 
OPA gly thr ser cys leu ser gly pro pro pro pro arg ser pro ala val cys gin his 
61/21 91/31 

gtg cag atg act cca cgc age ctt gtt cgc ate gtt ggt gtc gtg gtt gcg acg acc ttg 
val gin met thr pro arg ser leu val arg ile val gly val val val ala thr thr leu 
121/41 " 151/51 

gcg ctg gtg age gca ccc gee ggc ggt cgt gec gcg cat gcg gat ccg tgt teg gac ate 
ala leu val ser ala pro ala gly gly arg ala ala his ala asp pro cys ser asp ile 
181/61 211/71 

gcg gtc gtt ttc get cgc ggc acg cat cag get tct ggt ctt ggc gac gtc ggt gag gcg 
ala val val phe ala arg gly thr his gin ala ser gly leu gly asp val gly glu ala 
241/81 271/91 

ttc gtc gac teg ctt acc teg caa gtt ggc ggg egg teg att ggg gtc tac gcg gtg aac 
phe val asp ser leu thr ser gin val gly gly arg ser ile gly val tyr ala val asn 
301/101 331/111 

tac cca gca age gac gac tac cgc gcg age gcg tea aac ggt tec gat gat gcg age gee 
tyr pro ala ser asp asp tyr arg ala ser ala ser asn gly ser asp asp ala ser ala 
361/121 391/131 

cac ate cag cgc aec gtc gee age tgc ccg aac acc agg att gtg ctt ggt ggc tat teg 
his ile gin arg thr val ala ser cys pro asn thr arg ile val leu gly gly tyr ser 
421/141 451/151 

cag ggt gcg acg gtc ate gat ttg tec acc teg gcg atg ccg ccc gcg gtg gca gat cat 
gin gly ala thr val ile asp leu ser thr ser ala met pro pro ala val ala asp his 
481/161 511/171 

gtc gec get gtc gec ctt ttc ggc gag cca tec agt ggt ttc tec age atg ttg tgg ggc 
val ala ala val ala leu phe gly glu pro ser ser gly phe ser ser met leu trp gly 
541/181 " 571/191 

ggc ggg teg ttg ccg aca ate ggt ccg ctg tat age tct aag acc ata aac ttg tgt get 
gly gly ser leu pro thr ile gly pro leu tyr ser ser lys thr ile asn leu cys ala 
601/201 631/211 

ccc gac gat cca ata tgc aec gga ggc ggc aat att atg gcg cat gtt teg tat gtt cag 
pro asp asp pro ile cys thr gly gly gly asn ile met ala his val ser tyr val gin 
661/221 691/231 

teg ggg atg aca age cag gcg gcg aca ttc gcg gcg aac agg etc gat cac gec gga tga 
ser gly met thr ser gin ala ala thr phe ala ala asn arg leu asp his ala gly OPA 



SEQ ID N° 13F 
FIGURE 13F 



FEUlUE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCI7FR98/01813 



43/185 



31/11 

CCA CCG GGG CTG GAG GGG CGA ATG TGC GCC GAA CGC CGT CGG CCA ACT TGG CCG CTG AGG 
pro pro gly leu glu gly arg met eys ala glu arg arg arg pro thr trp pro leu arg 
61/21 91/31 

GCG GCT GAT CCC CTG GCC CGA GAC GGG GCA AGC CAA TAG CGG CTC CAT CGG GCT TTG CTG 
ala ala asp pro leu ala arg asp gly ala ser gin AHB arg leu his arg ala leu leu 
121/41 151/51 

GTA GCG GTT CGG CGG GAA CCG AGC GCC GAC GTT GTC GGT GCC CGG TGA TAT ATT GGG TCA 
val ala val arg arg glu pro ser ala asp val val gly ala arg OPA tyr ile gly ser 
181/61 211/71 

GAC GGG TAT GGC GGC GAC TGA GGT GAT CTG CGA CAC GCC GCC GCG GTG CTC GAG CCA GGC 
asp gly tyr gly gly asp OPA gly asp leu arg his ala ala ala val leu glu pro gly 
241/81 271/91 

TTA CGA CCA GGG AAT TTC GAA AAT GTT ATT CAG AAC ATC TTG TAT CTC TTC CTC CGT GCC 
leu arg pro gly asn phe glu asn val ile gin asn ile leu tyr leu phe leu arg ala 
301/101 331/111 

ACC CCC TAG GTG TAG TGT TTT CGA GTA CCG GCA GAT CCC AGT TCA CCA GTC TCA CCA GAT 
thr pro AMB val AMB cys phe arg val pro ala asp pro ser ser pro val ser pro asp 



SEQ ID N° 14A 
FIGURE 14A 



* 32/11 

CAC CGG GGC TGG AGG GGC GAA TGT GCG CCG AAC GCC GTC GGC CAA CTT GGC CGC TGA GGG 
his arg gly trp arg gly glu cys ala pro asn ala val gly gin leu gly arg OPA gly 
62/21 92/31 

CGG CTG ATC CCC TGG CCC GAG ACG GGG CAA GCC AAT AGC GGC TCC ATC GGG CTT TGC TGG 
arg leu ile pro trp pro glu thr gly gin ala asn ser gly ser ile gly leu cys trp 
122/41 152/51 

TAG CGG TTC GGC GGG AAC CGA GCG CCG ACG TTG TCG GTG CCC GGT GAT ATA TTG GGT CAG 
AMB arg phe gly gly asn arg ala pro thr leu ser val pro gly asp ile leu gly gin 
182/61 212/71 

ACG GGT ATG GCG GCG ACT GAG GTG ATC TGC GAC ACG CCG CCG CGG TGC TCG AGC CAG GCT 
thr gly met ala ala thr glu val ile cys asp thr pro pro arg cys ser ser gin ala 
242/81 272/91 

TAG GAC CAG GGA ATT TCG AAA ATG TTA TTC AGA ACA TCT TGT ATC TCT TCC TCC GTG CCA 
tyr asp gin gly ile ser lys met leu phe arg thr ser cys ile ser ser ser val pro 
302/101 332/111 

CCC CCT AGG TGT AGT GTT TTC GAG TAC CGG CAG ATC CCA GTT CAC CAG TCT CAC CAG ATC 
pro pro arg cys ser val phe glu tyr arg gin ile pro val his gin ser his gin ile 



SEQ ID N Q 14B 



FIGURE 14B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/018I3 



44/185 



33/11 



ACC GGG 


GCT 


GGA 


GGG 


GCG 


AAT 


GTG 


CGC 


CGA ACG CCG 


TCG GCC AAC TTG GCC GCT 


GAG 


GGC 


thr gly 


ala 


gly 


gly 


ala 


asn 


val 


arg 


arg thr pro 


ser ala asn leu ala ala 


glu gly 


63/21 
















93/31 








GGC TGA 


TCC 


CCT 


GGC 


CCG 


AGA 


CGG 


GGC 


AAG CCA ATA 


GCG GCT CCA TCG GGC TTT 


GCT 


GGT 


gly OPA 


ser 


pro 


gly 


pro 


arg 


arg 


gly 


lys pro ile 


ala ala pro ser gly phe 


ala gly 


123/41 
















153/51 








AGC GGT 


TCG 


GCG 


GGA 


ACC 


GAG 


CGC 


CGA 


r*ftn n*r**n r*/-*r* 

CGT TGT CGG 


TGC CCG GTG ATA TAT TGG 


GTC 


AGA 


ser gly 


ser 


ala 


gly 


thr 


glu 


arg 


arg 


arg cys arg 


cys pro val ile tyr trp 


val 


arg 


183/61 
















213/71 








CGG GTA 


TGG 


CGG 


CGA 


CTG 


AGG 


TGA 


TCT 


GCG ACA CGC 


CGC CGC GGT GCT CGA GCC 


AGG 


CTT 


arg val 


trp 


arg 


arg 


leu 


arg 


OPA 


ser 


ala thr arg 


arg arg gly ala arg ala 


arg 


leu 


243/81 
















273/91 








ACG ACC 


AGG 


GAA 


TTT 


CGA 


AAA 


TGT 


TAT 


TCA GAA CAT 


CTT GTA TCT CTT CCT CCG 


TGC 


CAC 


thr thr 


arg 


glu 


phe 


arg 


lys 


cys 


tyr 


ser glu his 


leu val ser leu pro pro 


cys 


his 


303/101 
















333/111 








CCC CTA 


GGT 


GTA 


GTG 


TTT 


TCG 


AGT 


ACC 


GGC AGA TCC 


CAG TTC ACC AGT CTC ACC 


AGA 


TC 


pro leu 


gly 


val 


val 


phe 


ser 


ser 


thr 


gly arg ser 


gin phe thr ser leu thr 


arg 





SEQ ID N° 14C 
FIGURE 14C 



partie de la sequence nucleotidique de seg!4A 
1/1 31/11 

TTT TCG AGT ACC GGC AGA TCC CAG GTT CAC CAG GTC TCA CCA GAT C 
phe ser ser thr gly arg ser gin val his gin val ser pro asp 

SEQ ID N° 14A' 
FIGURE 14 A » 



1/1 31/11 

TGT TTT CGA GTA CCG GCA GAT CCC AGG TTC ACC AGG TCT CAC CAG ATC 
cys phe arg val pro ala asp pro arg phe thr arg ser his gin ile 

SEQ ID N° 14C 

FIGURE 14C 



1/1 31/11 

GTT TTC GAG TAC CGG CAG ATC CCA GGT TCA CCA GGT CTC ACC AGA TC 
val phe glu tyr arg gin ile pro gly ser pro gly leu thr arg 



SEQ ID N° 14C 



FIGURE 14C 
FEUILLE DE REM PLACEMENT (REGLE 26) 



WO 99/09186 



45/185 



PCT/FR98/01813 



ORF predite d'apres la sequence publiee 
contenant seq!4A' 



1/1 














TAG CGG 


TTC 


GGC 


GGG AAG 


CTA GCG 


GCG 


ACG 


AMB arg 


pne 


gly gly lys 


leu ala 


ala 


thr 


61/21 














ACG GGT 


ATG 


GCG 


GCG GCT 


GAG GTG ATC 


TGC 


thr gly 


met 


ala 


ala ala 


glu val 


lie 


cys 


121/41 














TAG GAC 


CAG 


GGA ATT TCG 


AAA ATG 


TTA TTC 


tyr asp 


gin 


gly 


ile ser 


lys met leu phe 


181/61 














CCC CTA 


GGT 


GTA 


GTG TTT 


TCG AGT 


ACC 


GGC 


pro leu 


gly 


val 


val phe 


ser ser 


thr 


gly 


241/81 














cca egg 


ggc 


gcg 


atg aac 


ttc ccg 


gca teg 


pro arg 


gly 


ala 


met asn 


phe pro ala 


ser 


301/101 














tat gac 


ggg 


aat 


ctg gag 


cct tgt 


egg 


gec 


tyr asp 


gly 


asn 


leu glu 


pro cys 


arg 


ala 


361/121 














teg ttg 


cca 


gat 


cet gtc 


aga ttc 


ccg 


att 


ser leu 


pro 


asp 


pro val 


arg phe 


pro 


ile 


421/141 














gac cgt 


tta 


cac 


taa 








asp arg 


leu 


his 


OCH 









par Cole et al. (Nature 393:537-544) et 



Jl/ 11 


















TTG TCG 


GTG 


GCC 


GGT 


GAT 


ATA 


TTG 


GGT 


CAG 


leu ser 


val 


ala 


gly asp 


lie 


leu 


gly 


gin 


91/31 


















GAC ACG 


CCG 


CCG 


CGG 


TGC 


TCG 


AGC 


CAG 


GCT 


asp thr 


pro 


pro 


arg 


cys 


ser 


ser 


_ i _ 
gin 


ala 


















AGA ACA 


TCT 


TGT 


ATC 


TCT 


TCT 


CCG 


TGC 


CAC 


arg thr 


ser 


cys 


ile 


ser 


ser 


pro 


cys 


his 


211/71 


















AGA TCC 


CAG 


GTT 


CAC 


CAG 


GTC 


TCA 


CCA 


gat 


arg ser 


gin 


val 


his 


gin 


val 


ser 


pro 


asp 


271/91 
















gca teg 


cca 


ggt 


cga 


egg 


a eg 


tgg 


teg 


cgc 


ala ser 


pro 


gly 


arg 


arg 


thr 


trp 


ser 


arg 


331/111 


















get caa 


cat 


ate 


gaa 


gat 


gca 


eta 


ctt 


gag 


ala gin 


his 


ile 


glu asp 


ala 


leu 


leu 


glu 


391/131 


















tec gca 


aag 


gag 


egg 


tac 


gee 


cat 


gac 


cgt 


ser ala 


lys 


glu 


arg 


tyr 


ala 


his 


asp 


arg 



SEQ ID N° 14F 
FIGURE 14F 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



46/185 



Sequence Rv3054c predite par Cole et 1. 
pouvant etre en phase avec Seql4A' 

1/1 

gtg tea gat ace aag tec gac ate aaa ate 
val ser asp thr lys ser asp ile lys ile 
61/21 

teg ttc aac ege cag ate gec gag ctg get 
ser phe asn arg gin ile ala glu leu ala 
121/41 

acc atg ttc gag ggg ctg ggg gac ctg ecg 
thr met phe glu gly leu gly asp leu pro 
181/61 

gag gtg ecg gcg ccg gtg age gcg ttg egg 
glu val pro ala pro val ser ala leu arg 
241/81 

gtg gtc acg ecg gaa tac aac ggc age att 
val val thr pro glu tyr asn gly ser ile 
301/101 

ctg tec agg cca ttc ggc gat ggc gcg ttg 
leu ser arg pro phe gly asp gly ala leu 
361/121 

tec atg ggc cgc tac ggc ggg gta tgg gcg 
ser met gly arg tyr gly gly val trp ala 
421/141 

get ggc acg egg gtg gtc gat gcg ate aaa 
ala gly thr arg val val asp ala ile lys 
481/161 

teg gtc gcg gac gac gee ggg ctg gcg gcg 
ser val ala asp asp ala gly leu ala ala 
541/181 

get gag gtc ggc tga 
ala glu val gly OPA 



(Nature 393:537-544) 
31/11 

ttg gee tta gtg gga age ctg cgc gcg gcg 
leu ala leu val gly ser leu arg ala ala 
91/31 

gee aag gtc get ccg gac ggc gtc acc gtc 
ala lys val ala pro a3p gly val thr val 
151/51 

ttc tac aac gaa gac ate gac aca gcg acg 
phe tyr asn glu asp ile asp thr ala thr 
211/71 

gag gee gcg tct gac gcg cae get gec ttg 
glu ala ala ser asp ala his ala ala leu 
271/91 

ccg gee gtg ate aag aac gcg ate gac tgg 
pro ala val ile lys asn ala ile asp trp 
331/111 

aag gac aag ccg ttg gec gtg ate ggc ggc 
lys asp lys pro leu ala val ile gly gly 
391/131 

cae gac gag act cgc aag teg ttc age ate 
his asp glu thr arg lys ser phe ser ile 
451/151 

ctg teg gtg ccg ttc caa act etg ggc aag 
leu ser val pro phe gin thr leu gly lys 
511/171 

aat gtg cgc gac gec gtc ggc aac ttg gec 
asn val arg asp ala val gly asn leu ala 



SEQ ID N° 14R 



FIGURE 14R 



FEUILLE DE REPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



47/185 



ORF predite par Cole et al. (Nature 393:537-544) et contenant Rv3054c 
1/1 31/11 

taa cgc gat egg aat aaa teg gac cat ggt ccg gtt ggc teg tgc aag gac gtg gac caa 
OCH arg asp arg asn lys ser asp his gly pro val gly ser cys lys asp val asp gin 
61/21 91/31 

caa gcg gaa agg aac gta gca gtg tea gat acc aag tec gac ate aaa ate ttg gee tta 
gin ala glu arg asn val ala val ser asp thr lys ser asp lie lys ile leu ala leu 
121/41 151/51 

gtg gga age ctg cgc gcg gcg teg ttc aac cgc cag ate gee gag ctg get gec aag gtc 
val gly ser leu arg ala ala ser phe asn arg gin ile ala glu leu ala ala lys val 
181/61 211/71 

get ccg gac ggc gtc acc gtc acc atg ttc gag ggg ctg ggg gac ctg ccg ttc tac aac 
ala pro asp gly val thr val thr met phe glu gly leu gly asp leu pro phe tyr asn 
241/81 271/91 

gaa gac ate gac aca gcg acg gag gtg ccg gcg ccg gtg age gcg ttg egg gag gee gcg 
glu asp ile asp thr ala thr glu val pro ala pro val ser ala leu arg glu ala ala 
301/101 331/111 

tct gac gcg cac get gec ttg gtg gtc acg ccg gaa tac aac ggc age att ccg gee gtg 
ser asp ala his ala ala leu val val thr pro glu tyr asn gly ser ile pro ala val 
361/121 391/131 

ate aag aac gcg ate gac tgg ctg tec agg cca ttc ggc gat gge gcg ttg aag gac aag 
ile lys asn ala ile asp trp leu ser arg pro phe gly asp gly ala leu lys asp lys 
421/141 451/151 

ccg ttg gec gtg ate ggc ggc tec atg ggc cgc tac ggc ggg gta tgg gcg cac gac gag 
pro leu ala val ile gly gly ser met gly arg tyr gly gly val trp ala his asp glu 
481/161 511/171 

act cgc aag teg ttc age ate get ggc acg egg gtg gtc gat gcg ate aaa ctg teg gtg 
thr arg lys ser phe 3er ile ala gly thr arg val val asp ala ile lys leu ser val 
541/181 571/191 

ccg ttc caa act ctg ggc aag teg gtc gcg gac gac gee ggg ctg gcg gcg aat gtg cgc 
pro phe gin thr leu gly lys ser val ala asp asp ala gly leu ala ala asn val arg 
601/201 631/211 
gac gee gtc ggc aac ttg gee get gag gtc ggc tga 
asp ala val gly asn leu ala ala glu val gly OPA 

SEQ ID N° 14P 
FIGURE 14P 



FEUILLE DE REMPLACEIUIENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



48/185 

fragment d'apres la sequence publiee par Cole et al, {Nature 393:537-544) et contenant 
seq 14F 1 et seq 14P* 

1/1 31/11 

taa cgc gat egg aat aaa teg gac cat ggt ccg gtt ggc teg tge aag gac gtg gac caa 
OCH arg asp arg asn lys ser asp his gly pro val gly ser cys lys asp val asp gin 
asn ala lie gly ile asn arg thr met val arg leu ala arg ala arg thr trp thr asn 
thr arg ser glu OCH ile gly pro trp ser gly trp leu val gin gly arg gly pro thr 
61/21 91/ 31 

caa gcg gaa agg aac gta gca gtg tea gat acc aag tec gac ate aaa ate ttg gec tta 
gin ala glu arg asn val ala val ser asp thr lys ser asp ile lys ile leu ala leu 
lys arg lys gly thr AMB gin cys gin ile pro ser pro thr ser lys ser trp pro amb 
ser gly lys glu arg ser ser val arg tyr gin val arg his gin asn leu gly leu ser 
121/41 151/51 

gtg gga age ctg cgc gcg gcg teg ttc aac cgc eag ate gee gag ctg get gee aag gtc 
val gly ser leu arg ala ala ser phe asn arg gin ile ala glu leu ala ala lys val 

trp glu ala cys ala arg arg arg ser thr ala arg ser pro ser trp leu pro arg ser 
gly lys pro ala arg gly val val gin pro pro asp arg arg ala gly cys gin alv arc 
181/61 211/71 9 Y 9 

get ccg gac ggc gtc acc gtc acc atg ttc gag ggg ctg ggg gac ctg ccg ttc tac aac 
ala pro asp gly val thr val thr met phe glu gly leu gly asp leu pro phe tyr asn 

leu arg thr ala ser pro ser pro cys ser arg gly trp gly thr cys arg ser thr thr 
ser gly arg arg his arg his his val arg gly ala gly gly pro ala val leu gin arg 
241/81 271/91 

gaa gac ate gac aca gcg acg gag gtg ccg gcg ccg gtg age gcg ttg egg gag gee gcg 
glu asp ile asp thr ala thr glu val pro ala pro val ser ala leu arg glu ala ala 
lys thr ser thr gin arg arg arg cys arg arg arg OPA ala arg cys gly arg pro arg 
arg his arg his ser asp gly gly ala gly ala gly glu arg val ala gly gly arg val 
301/101 331/111 

tct gac gcg cac get gee ttg gtg gtc acg ccg gaa tac aac ggc age att ccg gec gtg 
ser asp ala his ala ala leu val val thr pro glu tyr asn gly ser ile pro ala val 
leu thr arg thr leu pro trp trp ser arg arg asn thr thr ala ala phe arg pro OPA 
OPA arg ala arg cys leu gly gly his ala gly ile gin arg gin his ser gly arg asp 
361/121 3917131 

ate aag aac gcg ate gac tgg ctg tec agg cca ttc ggc gat ggc gcg ttg aag gac aag 
ile lys asn ala ile asp trp leu ser arg pro phe gly asp gly ala leu lys asp lys 
ser arg thr arg ser thr gly cys pro gly his ser ala met ala arg OPA arg thr ser 
gin glu arg asp arg leu ala val gin ala ile arg arg trp arg val glu gly gin ala 
421/141 451/151 

ccg ttg gec gtg ate ggc ggc tec atg ggc cgc tac ggc ggg gta tgg gcg cac gac gag 
pro leu ala val ile gly gly ser met gly arg tyr gly gly val trp ala his asp glu 
arg trp pro OPA ser ala ala pro trp ala ala thr ala gly tyr gly arg thr thr arg 
val gly arg asp arg arg leu his gly pro leu arg arg gly met gly ala arg arg asp 
481/161 511/171 

act cgc aag teg ttc age ate get ggc acg egg gtg gtc gat gcg ate aaa ctg teg gtg 
thr arg lys ser phe ser ile ala gly thr arg val val asp ala ile lys leu ser val 
leu ala ser arg ser ala ser leu ala arg gly trp ser met arg ser asn cys arg cy3 
ser gin val val gin his arg trp his ala gly gly arg cys asp gin thr val glv ala 
541/181 571/191 

ccg ttc caa act ctg ggc aag teg gtc gcg gae gac gee ggg ctg gcg gcg aat gtg cgc 
pro phe gin thr leu gly lys ser val ala asp asp ala gly leu ala ala asn val arg 
arg aer lys leu trp ala ser arg ser arg thr thr pro gly trp arg arg met cys ala 
val pro asn ser gly gin val gly arg gly arg arg arg ala gly gly glu cys ala arcr 
601/201 631/211 

gac gec gtc ggc aac ttg gec get gag gtc ggc tga tec ctg ggc cga ggc ggg tea gec 
asp ala val gly asn leu ala ala glu val gly OPA ser leu gly arg gly gly 3 er ala 
thr pro ser ala thr trp pro leu arg ser ala asp pro trp ala glu ala gly gin pro 
arg arg arg gin leu gly arg OPA gly arg leu ile pro gly pro arg arg val ser gin 
661/221 691/231 

aat age ggc tec ate ggc ttt get ggt age ggt teg gcg gga age tag egg cga cgt tgt 
asn ser gly ser ile gly phe ala gly ser gly ser ala gly ser AMB arg arg arg cys 
ile ala ala pro ser ala leu leu val ala val arg arg glu ala sec gly asp val val 
AMB arg leu his arg leu cys trp AMB arg phe gly gly lys leu ala ala thr leu ser 



SEQ ID N° 14Q 



FEUILLE DE REM£^Qf^E{\|J^( REGIE 26) 



WO 99/09186 



PCT/FR98/01813 



49/185 



721/241 751/251 

egg tgg ccg gtg ata tat tgg gtc aga egg gta tgg egg egg ctg agg tga tct gcg aca 
arg trp pro val ile tyr trp val arg arg val trp arg arg leu arg OPA ser ala thr 
gly gly arg OPA tyr ile gly ser asp gly tyr gly gly gly OPA gly asp leu arg his 
val ala gly asp ile leu gly gin thr gly met ala ala ala glu val ile cys asp thr 
781/261 811/271 

cgc cgc cgc ggt get cga gee agg ctt acg acc agg gaa ttt cga aaa tgt tat tea gaa 
arg arg arg gly ala arg ala arg leu thr thr arg glu phe arg lys cys tyr ser glu 
ala ala ala val leu glu pro gly leu arg pro gly asn phe glu asn val ile gin asn 
pro pro arg cys ser ser gin ala tyr asp gin gly ile ser lys met leu phe arg thr 
841/281 871/291 

cat ctt gta tct ctt etc cgt gee acc ccc tag gtg tag tgt ttt cga gta ccg gca gat 
his leu val ser leu leu arg ala thr pro AMB val AMB cys phe arg val pro ala asp 
ile leu tyr leu phe ser val pro pro pro arg cys ser val phe glu tyr arg gin ile 
ser eys ile ser ser pro cys his pro leu gly val val phe ser ser thr gly arg ser 
901/301 931/311 

ccc agg ttc acc agg tct cac cag ate cac ggg gcg cga tga act tec egg cat egg cat 
pro arg phe thr arg ser his gin ile his gly ala arg OPA thr ser arg his arg his 
pro gly ser pro gly leu thr arg ser thr gly arg asp glu leu pro gly ile gly ile 

gin val his gin val ser pro asp pro arg gly ala met asn phe pro ala ser ala ser 
961/321 991/331 

cgc cag gtc gac gga cgt ggt cgc get atg acg gga ate tgg age ctt gtc ggg ccg etc 
arg gin val asp gly arg gly arg ala met thr gly ile trp ser leu val gly pro leu 
ala arg ser thr asp val val ala leu OPA arg glu aer gly ala leu ser gly arg ser 

pro gly arg arg thr trp ser arg tyr asp gly asn leu glu pro cys arg ala ala gin 
1021/341 1051/351 

aac ata teg aag atg cac tac ttg agt cgt tgc eag ate ctg tea gat tec cga ttt ccg 
asn ile ser lys met his tyr leu ser arg cys gin ile leu ser asp ser arg phe pro 
thr tyr arg arg cys thr thr OPA val val ala arg aer cys gin ile pro asp phe arg 
his ile glu asp ala leu leu glu ser leu pro asp pro val arg phe pro ile ser ala 
1081/361 1111/371 
caa agg age ggt acg ccc atg acc gtg acc gtt tac act aa 
gin arg ser gly thr pro met thr val thr val tyr thr 
lys gly ala val arg pro OPA pro OPA pro phe thr leu 
lys glu arg tyr ala his asp arg asp arg leu his OCH 



SEQ ID N° 14Q (suite) 
FIGURE 14Q (suite) 



1/1 








31/11 


















CAA GCC CGG 


CCG CGA CTG TTT GCC 


GTT TTG 


GGG CTC 


CTA 


CCA 


GAA 


CAC 


CAC 


CTG 


GCG 


GCC 


gin ala arg 


pro arg leu phe ala 


val 


leu 


gly leu 


leu 


pro 


glu 


his 


his 


leu 


ala 


ala 


61/21 








91/31 


















GCG CAC CAT 


GGT GTG CAC CAG TTG 


CGA 


TCG 


GTT CCT 


CCC 


GCG 


CGC 


GGG 


CGG 


CGA 


CGA 


CGT 


ala his his 


gly val his gin leu 


arg 


ser 


val pro 


pro 


ala 


arg 


gly 


arg 


arg 


arg 


arg 


121/41 








151/51 


















CGA TGC CCG 


CGC CCC GGC GGC GCA 


GCT 


GCG 


TAG CTC 


GAC 


CCG 


GTC 


GAC 


GAC 


GAC 


GGG 


GTC 


arg cys pro 


arg pro gly gly ala 


ala 


ala 


AMB leu 


asp 


pro 


val 


asp 


asp 


asp 


gly val 


181/61 








211/71 


















GGC GGA CCA 


GTC GGG GAT GTC GAG 


GCG ATG 


GCA ATA 


CAG 


CGC 


CTT 


GGT 


GCG 


CGG 


CCA 


CAC 


gly gly 


val gly asp val glu 


ala 


met 


ala ile 


gin 


arg 


leu 


gly 


ala 


arg 


pro 


his 


241/81 








271/91 


















GTC TGA GGT 


GGC GAA GAC CAG TCC 


CGC 


GCC 


CAC CGG 


CAG 


CCG 


GAT 


CCG 


GAT 


ACG 


CGG 


TAC 


val OPA gly 


gly glu asp gin ser 


arg 


ala 


his arg 


gin 


pro 


asp 


pro 


asp 


thr 


arg 


tyr 



SEQ ID N° 15A 
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32/11 

AAG CCC GGC CGC GAC TGT TTG CCG TTT TGG GGC TCC TAC CAG AAC ACC ACC TGG CGG CCG 
lys pro gly arg asp cys leu pro phe trp gly ser tyr gin asn thr thr trp arg pro 
62/21 92/31 

CGC ACC ATG GTG TGC ACC AGT TGC GAT CGG TTC CTC CCG CGC GCG GGC GGC GAC GAC GTC 
arg thr met val cys thr ser cys asp arg phe leu pro arg ala gly gly asp asp val 
122/41 152/51 

GAT GCC CGC GCC CCG GCG GCG CAG CTG CGT AGC TCG ACC CGG TCG ACG ACG ACG GGG TCG 
asp ala arg ala pro ala ala gin leu arg ser ser thr arg ser thr thr thr gly ser 
182/61 212/71 

GCG GAC CAG TCG GCG ATG TCG AGG CGA TGG CAA TAC AGC GCC TTG GTG CGC GGC CAC ACG 
ala asp gin ser ala met ser arg arg trp gin tyr ser ala leu val arg gly his thr 
242/81 272/91 

TCT GAG GTG GCG AAG ACC AGT CCC GCG CCC ACC GGC AGC CGG ATC CGG ATA CGC GGT AC 
ser glu val ala lys thr ser pro ala pro thr gly ser arg ile arg ile arg gly 



SEQ ID N° 15B 
FIGURE 15B 



33/11 

AGC CCG GCC GCG ACT GTT TGC CGT TTT GGG GCT CCT ACC AGA ACA CCA CCT GGC GGC CGC 
ser pro ala ala thr val cys arg phe gly ala pro thr arg thr pro pro gly gly arg 
63/21 93/31 

GCA CCA TGG TGT GCA CCA GTT GCG ATC GGT TCC TCC CGC GCG CGG GCG GCG ACG ACG TCG 
ala pro trp cys ala pro val ala ile gly ser ser arg ala arg ala ala thr thr ser 
123/41 153/51 

ATG CCC GCG CCC CGG CGG CGC AGC TGC GTA GCT CGA CCC GGT CGA CGA CGA CGG GGT CGG 
met pro ala pro arg arg arg ser cys val ala arg pro gly arg arg arg arg gly arg 
183/61 213/71 

CGG ACC AGT CGG CGA TGT CGA GGC GAT GGC AAT ACA GCG CCT TGG TGC GCG GCC ACA CGT 
arg thr ser arg arg cys arg gly asp gly asn thr ala pro trp cys ala ala thr arg 
243/81 273/91 

CTG AGG TGG CGA AGA CCA GTC CCG CGC CCA CCG GCA GCC GGA TCC GGA TAC GCG GTA C 
leu arg trp arg arg pro val pro arg pro pro ala ala gly ser gly tyr ala val 



SEQ ID N D 15C 
FIGURE 15C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 PO7FR98/01813 

51/185 

partie do la sequence nucleotidlque de seq!5A 
1/1 31/U 

GGC GGC CGC GCG CCA TGG TGT GCA CCA GTT GCG ATC GGT TCT CCC GCG CGC GGG CGG CGA 
gly gly arg ala pro trp cys ala pro val ala ile gly ser pro ala arg gly arg arg 
61/21 91/31 

CGA CGT CGA TGG CCG CGC CCC GGC GGC TGC AGC TGC GTA GCT CGA CCC GGT CGA CGA CGA 
arg arg arg trp pro arg pro gly gly cys ser cys val ala arg pro gly arg arg arg 
121/41 151/51 

CGG GGT CGG CGG GCC AGT CGG CGA TGT CGA GGC GAT GGC AAT ACA GCG CCT TGG TGC GCG 
arg gly arg arg ala ser arg arg cys arg gly asp gly asn thr ala pro trp cys ala 
181/61 211/71 

GCC ACA CGT CTG AGG TGG CGA AGA CCA GTC CCG CGC CCA CCG GCA GCC GGA TC 
ala thr arg leu arg trp arg arg pro val pro arg pro pro ala ala gly 

SEQ ID tt° 15A* 
FIGURE ISA' 



1/1 








31/11 














GCG GCC GCG CGC CAT GGT GTG 


CAC 


CAG 


TTG 


CGA TCG 


GTT CTC 


CCG 


CGC 


GCG 


GGC GGC 


GAC 


ala ala ala arg his gly val his 


gin 


leu 


arg ser 


val leu 


pro 


arg 


ala 


gly gly asp 


61/21 








91/31 














GAC GTC GAT GGC CGC GCC CCG 


GCG 


GCT 


GCA 


GCT GCG 


TAG CTC 


GAC 


CCG 


GTC 


GAC GAC 


GAC 


asp val asp gly arg ala pro 


ala 


ala 


ala 


ala ala 


AMB leu 


asp 


pro 


val 


asp asp 


asp 


121/41 








151/51 














GGG GTC GGC GGG CCA GTC GGC 


GAT 


GTC 


GAG 


GCG ATG 


GCA ATA 


CAG 


CGC 


CTT 


GGT GCG 


CGG 


gly val gly gly pro val gly 


asp 


val 


glu 


ala met 


ala ile 


gin 


arg 


leu 


gly ala 


arg 


181/61 








211/71 














CCA CAC GTC TGA GGT GGC GAA 


GAC 


CAG 


TCC 


CGC GCC 


CAC CGG 


CAG 


CCG 


GAT 


C 




pro his val OPA gly gly glu 


asp 


gin 


ser 


arg aia 


his arg gin 


pro 


asp 







SEQ ID N° 15B' 
FIGURE 15B' 



1/1 

TGG CGG CCG CGC GCC ATG GTG TGC ACC AGT 
trp arg pro arg ala met val cys thr ser 
61/21 

ACG ACG TCG ATG GCC GCG CCC CGG CGG CTG 
thr thr ser met ala ala pro arg arg leu 
121/41 

ACG GGG TCG GCG GGC CAG TCG GCG ATG TCG 
thr gly ser ala gly gin ser ala met ser 
181/61 

GGC CAC ACG TCT GAG GTG GCG AAG ACC AGT 
gly his thr ser glu val ala lys thr ser 



31/11 

TGC GAT CGG TTC TCC CGC GCG CGG GCG GCG 
cvs asp arg phe ser arg ala arg ala ala 
91/31 

CAG CTG CGT AGC TCG ACC CGG TCG ACG ACG 
gin leu arg ser ser thr arg ser thr thr 
151/51 

AGG CGA TGG CAA TAC AGC GCC TTG GTG CGC 
arg arg trp gin tyr ser ala leu val arg 
211/71 

CCC GCG CCC ACC GGC AGC CGG ATC 
pro ala pro thr gly ser arg ile 



SEQ ID N° 15C 
FEUILLE DE REIW?flm0SMBH(I! (REGLE 26) 



WO 99/09186 
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ORF contenant SeqlSA' d'apres Cole et al. (Nature 393:537-544) 
1/1 31/11 

taa ggt ccg cca acg ctt tac get cga egg ccg cca cga gtt ggc egg eca ctt tea ggc 
OCH gly pro pro thr leu tyr ala arg arg pro pro arg val gly arg pro leu ser gly 
61/21 " 91/31 

cgt agt cgc cgc agg gca ggg ctt ccc gcg teg tct teg egg gtt tgt egg caa agg tgt 
arg ser arg arg arg ala gly leu pro ala ser ser ser arg val cys arg gin arg cys 
121/41 151/51 

agg ggt age gtt cgt ggg cgt cga cga cga tgt gca get egg gga tgc egg egg cgc ggg 
arg gly ser val arg gly arg arg arg arg cys ala ala arg gly cys arg atg arg gly 
181/61 211/71 

egg tgg ggg tgc gca cgc ccg gee gcg act gtt tgc gcg ttt tgg ggc tct gee aga aca 
arg trp gly cys ala arg pro ala ala thr val cys ala phe trp gly ser ala arg thr 
241/81 271/91 

cca cct ggc ggc cgc gcg cca tgg tgt gca cca gtt gcg ate ggt tct ccc gcg cgc ggg 
pro pro gly gly arg ala pro trp cys ala pro val ala ile gly ser pro ala arg gly 
301/101 331/111 

egg cga cga cgt cga tgg ccg cgc ccc ggc ggc tgc age tgc gta get cga ccc ggt cga 
arg arg arg arg arg trp pro arg pro gly gly cys sei; cys val ala arg pro gly arg 
361/121 391/131 

cga cga egg ggt egg egg gec agt egg cga tgt cga ggc gat ggc aat aca gcg cct tgg 
arg arg arg gly arg arg ala ser arg arg cys arg gly asp gly asn thr ala pro trp 
421/141 451/151 

tgc gcg gec aca cgt etg agg tgg cga aga cca gtc ccg cgc cca ccg gca gec gga tea 
cys ala ala thr arg leu arg trp arg arg pro val pro arg pro pro ala ala gly ser 
481/161 511/171 

ggt agg gca ggc gcg agt ctt cag egg ggt tgg egg cga cga gca get oca cag agt gtg 
gly arg ala gly ala ser leu gin arg gly trp arg arg arg ala ala pro gin ser val 
541/181 ' 571/191 

agg gta egg gcg gcg tac ggc aac ggt gaa gca ggc act ccg acg aac cca teg tea cgt 
arg val arg ala ala tyr gly asn gly glu ala gly thr pro thr asn pro ser ser arg 
601/201 

cga agg ggc agg tga 
arg arg gly arg 0£A 



SEQ ID N Q 15F 
FIGURE 15F 
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ctg ggc 
leu gly 


tgg 
trp 


ccg 


aat 
asn 


cac gtt cac 
his val his 


teg aat 
ser asn 


ggg 

gly 


tgg 
trp 


gcc 
ala 


acc acg ccg 
thr thr pro 


cgc agt 
arg ser 


gtg 

vet.L 


atg 
met 


cag 
gin 


gtg teg acc 
val ser thr 


act tct 
thr set 


ctt 
leu 


gcc 
ala 


ggg 

gly 


cac acg ttt 
his thr phe 


ggc gat 
gly asp 


cgc 
arg 


gat 
asp 


gcg 
ala 


gtg tec aac 
val ser asn 


gcc gcg 
ala ala 


cgc 
arg 


tac 
tyr 


ggg 

gly 


ggc egg ttg 
gly arg leu 


gca ggc 
ala gly 


etc 
leu 


gtc 
val 


gag 
glu 


gtg ttg tag 
val leu AMB 



53/185 

l^Tellt^SmS ^ * 393:537 " 54 "»et pouvant etre en 

i/ 1 31/11 
gtg acg gca ctg etc gat gtc aat gtg ctg ate gcg 
val thr ala leu leu asp val asn val leu ile ala 
61/21 91/31 
cat gcg gcc gcg cag cga tgg ttc acg cag ttc tec 
his ala ala ala gin arg trp phe thr gin phe ser 
121/41 151/51 
ate acc gag gca ggg tat gtc cga att tea age aat 
ile thr glu ala gly tyr val arg ile ser ser asn 
181/61 211/71 
acg ccg get ate gcg ate get cag ttg gcg gcg atg 
thr pro ala ile ala ile ala gin leu ala ala met 
241/81 271/91 
tgg cct gac gat gtg cca ctg ate gtt ggg age gcc 
trp pro asp asp val pro leu ile val gly ser ala 
301/101 331/111 
cac cgt egg gtc acc gac tgc cat etc ate gcc ttg 
his arg arg val thr asp cys his leu ile ala leu 
361/121 391/131 
gtc aca ttc gat gcc gca ctg gcc gat tea gca tec 
val thr phe asp ala ala leu ala asp ser ala ser 

SEQ ID N° 15R 
FIGURE 15R 

SeqlSP: ORF d'apr6s Cole et al , (Nature 393:537-544) contenant Rv2530c 
i' 1 31/11 

tga tgt tec gcc gga tgc gcc gac ggt gac ttc cga gga tgt cgt ccg cgc get cga gqa 
OPA cys ser ala gly cys ala asp gly asp phe arg gly cys arg pro arg ala arg gly 
61/21 91/31 

cga cgt gtg acg gca ctg etc gat gtc aat gtg ctg ate gcg ctg ggc tgg ccg aat cac 
arg arg val thr ala leu leu asp val asn val leu ile ala leu gly trp pro asn his 
121/41 151/51 

gtt cac cat gcg gcc gcg cag cga tgg ttc acg cag ttc tec teg aat ggg tgg gcc acc 
val his his ala ala ala gin arg trp phe thr gin phe ser ser asn gly trp ala thr 
181/61 211/71 

acg ccg ate acc gag gca ggg tat gtc cga att tea age aat cgc agt gtg atg cag gtq 
thr pro ile thr glu ala gly tyr val arg ile ser ser asn arg ser val met gin val 
241/81 271/91 

teg acc acg ccg get ate gcg ate get cag ttg gcg gcg atg act tct ctt gcc gqq cac 
ser thr thr pro ala ile ala ile ala gin leu ala ala met thr ser leu ala gly his 
301/101 331/111 

acg ttt tgg Cct gac gat gtg cca ctg ate gtt ggg age gcc ggc gat cgc gat gcg gtg 
thr phe trp pro asp asp val pro leu ile val gly ser ala gly asp arg asp ala val 
361/121 391/131 

tec aac cac cgt egg gtc acc gac tgc cat etc ate gcc ttg gcc gcg cgc tac gqq aac 
ser asn his arg arg val thr asp cys his leu ile ala leu ala ala arg tyr gly alv 
421/141 451/151 

egg ttg gtc aca ttc gat gcc gca ctg gcc gat tea gca tec gca ggc etc gtc gag gtq 

481/161 ^ ^ 313 Sly l6U Val glU ™* 

ttg tag 
leu AMB 

SEQ ID N° 15P 
FEUILLE DE REMf^EJU|^(REGLE 26) 



WO 99/09186 



PCT/FR98/0t813 



54/185 



Fragment contenant SeqlSP' et Seq 15F' 
1/1 31/11 

tga tgt tee gee gga tgc gee gac ggt gac ttc cga gga tgt cgt ceg cge get cga gga 
OPA cys ser ala gly cys ala asp gly asp phe arg gly cys arg pro arg ala arg gly 
asp val pro pro asp ala pro thr val thr ser glu asp val val arg ala leu glu asp 
Met phe arg arg met arg arg arg OPA leu pro arg met ser ser ala arg ser arg thr 
61/21 91/3! 

cga cgt gtg acg gca ctg etc gat gtc aat gtg ctg ate gcg ctg ggc tgg ccg aat cac 
arg arg val thr ala leu leu asp val asn val leu ile ala leu gly trp pro aan his 
asp val OPA arg his cys ser met ser met cys OPA ser arg trp ala gly arg ile thr 

121/41 Cy3 a3P 9ly leU ala glu 3ec ar « 

' isi/si 

gtt cac cat gcg gec gcg cag cga tgg ttc acg cag ttc tec teg aat ggg tgg gec acc 
val his his ala ala ala gin arg trp phe thr gin phe ser ser asn gly trp ala thr 
phe thr met arg pro arg ser asp gly ser arg ser ser pro arg met gly gly pro pro 

ser pro cys gly arg ala ala met val his ala val leu leu glu trp val gly his his 
181/61 211/71 

acg ccg ate acc gag gca ggg tat gtc cga att tea age aat cge agt gtg atg cag gtg 
thr pro ile thr glu ala gly tyr val arg ile ser ser asn arg ser val met gin val 
arg arg ser pro arg gin gly met ser glu phe gin ala ile ala val OPA cys arg cys 

o/ii /o, a3P ^ gly drg Val Cy3 pr ° a3n phe ly3 * ln 3er 9ln cys asp ala gly val 
241/81 271/91 

teg acc acg ccg get ate gcg ate get cag ttg gcg gcg atg act tct ctt gee ggg ca c 
ser thr thr pro ala ile ala ile ala gin leu ala ala met thr ser leu ala gly his 
arg pro arg arg leu ser arg ser leu ser trp arg arg OPA leu leu leu pro gly thr 

™w?J^ 3 ala 9iy tyr arg a3p arg 3er val *y Sly asp asp phe ser cys arg ala his 
301/101 331/111 

acg ttt tgg cet gac gat gtg cca ctg ate gtt ggg age gec ggc gat cge gat gcg gtg 
thr phe trp pro asp asp val pro leu ile val gly ser ala gly asp arg asp ala val 
arg phe gly leu thr met cys his OPA ser leu gly ala pro ala ile ala met arg cys 

,*Y a ^ eU ala ° PA arg Gy3 ala thr a3p arg trp alu a ^ arg arg ser arg cys gly val 
361/121 391/131 

tec aac cac cgt egg gtc acc gac tgc cat etc ate gee ttg gec gcg egc tac ggg gac 
ser asn his arg arg val thr asp cys his leu ile ala leu ala ala arg tyr gly gly 
pro thr thr yal gly ser pro thr ala ile ser ser pro trp pro arg ala thr gly ala 

^? 1 ,?.? r ° Pr ° 3Cr gly arg leu pro 3er arq leu *V ar <* ala leu arg gly pro 
421/141 451/151 

egg ttg gtc aca ttc gat gec gca ctg gec gat tea gca tec gca ggc etc gtc gag gtg 
arg leu val thr phe asp ala ala leu ala asp ser ala ser ala gly leu val glu val 
gly trp ser his ser met pro his trp pro ile gin his pro gin ala ser ser arg cys 

„ a Y a L? ly hlS 116 arg CyS arg thr gly arg phe ser ile ar <? ™? ^g arg gly val 
481/161 511/171 

ttg tag tea ccg ggg atg ggc ggc teg cca ggc ctg cag gat ctg egg gcg cag gcg cce 
leu AMB ser pro gly met gly gly ser pro gly leu gin asp leu arg ala gin ala pro 
cys ser his arg gly trp ala ala arg gin ala cys arg ile cys gly arg arg arg pro 

c„Y a ^Y al thr gly a3p gly arg leu ala arg pro ala *ly 3er ala *la gly ala pro 
541/181 571/191 

ccg gtc gga cac egg cag gec gac get ttt ggc cca egc gcg cag etc ggc get get ggg 
pro val gly his arg gin ala asp ala phe gly pro arg ala gin leu gly ala ala gly 
arg ser asp thr gly arg pro thr leu leu ala his ala arg ser ser ala leu leu gly 
gly arg thr pro ala gly arg arg phe trp pro thr arg ala ala arg arg cy 5 trp ala 
601/201 Kii/^n 



etc ggg etc ggc ggc age egg etc gaa aac cgt ggt ggc gtc ggc ate gtc gac gaa cca 
leu gly leu gly gly ser arg leu glu asn arg gly gly val gly ile val asp glu pro 
ser gly ser ala ala ala gly ser lys thr val val ala ser ala ser ser thr asn gin 
arg ala arg arg gin pro ala arg lys pro trp trp arg arg his arg arg arg thr arg 



SEQ ID N° 15Q 

FIGURE 15Q 
FEUILLE DE REMPLACEMENT (REGLE 26) 
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661/221 691/231 

ggt gag ggc ggc ggc tag ata gcg gta ggt gta ttc ctg ggc gag ctt gcg ggt ttg gca 
gly glu gly gly gly AMB ilo ala val gly val phe leu gly glu leu ala gly leu ala 
val arg ala ala ala arg AMB arg AMB val tyr ser trp ala ser leu arg val trp gin 

721/241 lY ^ Cy 751/25 Pr ° ^ ^ ^ ^ ^ 

gaa cac gat egg cac gtt ggg aaa gec gat ctg caa ttc ggc cag ccc ate ggc gat cgc 
glu his asp arg his val gly lys ala asp leu gin phe gly gin pro ile gly asp arg 
asn thr ile gly thr leu gly lys pro ile cys asn 3 er ala ser pro ser ala ile ala 
thr arg ser ala arg trp glu ser arg aer ala ile arg pro ala hia arg arg aer pro 
781/261 811/271 

cgt egg gcg ggc gaa gga gtg cgc gaa gat etc cga gta gcg gtc etc gac cac cac ggc 
arg arg ala gly glu gly val arg glu asp leu arg val ala val leu aap his his gly 
val gly arg ala lys glu cya ala lys ile ser glu AMB arg ser ser thr thr thr ala 
ser gly gly arg arg ser ala arg arg ser pro ser ser gly pro arg pro pro arc arq 
841/281 871/291 

ggc ecg tgg cag cgc ggc cag ttc ggt cag ttg gta ttt cag gtt gec gtt cag cac gec 
gly pro trp gin arg gly gin phe gly gin leu val phe gin val ala val gin his ala 
ala arg gly ser ala ala ser ser val ser trp tyr phe arg leu pro phe ser thr pro 
pro val ala ala arg pro val arg aer val gly ile ser gly cya arg ser ala arg qln 
901/301 931/311 

aga agt aag gtc cgc caa cgc ttt aeg etc gac gge cgc cac gag ttg gec ggc cac ttt 
arg ser lys val arg gin arg phe thr leu asp gly arg his glu leu ala gly his phe 
glu val arg ser ala aan ala leu arg ser thr ala ala thr ser trp pro ala thr phe 
lys OCH gly pro pro thr leu tyr ala arg arg pro pro arg val gly arg pro leu ser 
961/321 , 991/331 

cag gec gta gtc gec gca ggg cag ggc ttc ecg cgt cgt ctt cgc ggg ttt gtc ggc aaa 
gin ala val val ala ala gly gin gly phe pro arg arg leu arg gly phe val gly lys 
arg pro AMB ser pro gin gly arg ala ser arg val val phe ala gly leu ser ala lya 

gly arg ser arg arg arg ala gly leu pro ala ser aer aer arg val cya arq qln arc 
1021/341 1051/351 * 

ggt gta ggg gta gcg ttc gtg ggc gtc gac gac gat gtg cag etc ggg gat gec ggc ggc 
gly val gly val ala phe val gly val asp asp asp val gin leu gly aap ala gly gly 
val AMB gly AMB arg ser trp ala ser thr thr met cys ser aer gly met pro ala ala 

cys arg gly 3er val arg gly arg arg arg arg cys ala ala arg gly cys arq arq ara 
1081/361 1111/371 y 9 

gcg ggc ggt ggg ggt gcg cac gec egg ecg cga ctg ttt gcg cgt ttt ggg get ctg cca 
ala gly gly gly gly ala his ala arg pro arg leu phe ala arg phe gly ala leu pro 
arg ala val gly val arg thr pro gly arg asp cya leu arg val leu gly leu cys gin 

gly arg trp gly cys ala arg pro ala ala thr val cys ala phe trp gly aer ala arq 
114X/381 1171/391 

gaa cac cac ctg gcg gec gcg cgc cat ggt gtg cac cag ttg cga teg gtt etc ecg cgc 
glu hia his leu ala ala ala arg his gly val his gin leu arg ser val leu pro arg 
asn thr thr trp arg pro arg ala met val cys thr ser cys aap arg phe ser arg ala 
thr pro pro gly gly arg ala pro trp cya ala pro val ala ile gly ser pro ala arq 
1201/401 1231/411 ^ 

gcg ggc ggc gac gac gtc gat ggc cgc gec ecg gcg get gca get gcg tag etc gac ecg 
ala gly gly asp asp val asp gly arg ala pro ala ala ala ala ala AMB leu asp pro 
arg ala ala thr thr ser met ala ala pro arg arg leu gin leu arg aer ser thr arg 
gly arg arg arg arg arg trp pro arg pro gly gly cys ser cys val ala arq pro qlv 
1261/421 1291/431 * Y 

gtc gac gac gac ggg gtc ggc ggg eca gtc ggc gat gtc gag gcg atg gca ata cag cgc 
val asp asp asp gly val gly gly pro val gly asp val glu ala met ala ile gin arg 
ser thr thr thr gly aer ala gly gin ser ala met ser arg arg trp gin tyr ser ala 
arg arg arg arg gly arg arg ala ser arg arg cys arg gly asp gly asn thr ala pro 
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FIGURE 15Q (suite 1) 
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1321/441 1351/451 

ctt ggt gcg egg cca cac gtc tga ggt ggc gaa gac cag tec cgc gee cac egg cag ccg 
leu gly ala arg pro his val OPA gly gly glu asp gin ser arg ala his arg gin pro 
leu val arg gly his thr ser glu val ala ly3 thr sec pro ala pro thr gly ser arg 
trp cys ala ala thr arg leu arg trp arg arg pro val pro arg pro pro ala ala gly 
1381/461 1411/471 

gat cag gta ggg cag gcg cga gtc ttc age ggg gtt ggc ggc gac gag cag etc cac aga 
asp gin val gly gin ala arg val phe ser gly val gly gly asp glu gin leu hi3 arg 
ile arg AMB gly arg arg glu ser ser ala gly leu ala ala thr ser ser ser thr glu 
ser gly arg ala gly ala ser leu gin arg gly trp arg arg arg ala ala pro gin ser 
1441/481 1471/491 

gtg tga ggg tac ggg egg cgt acg gca acg gtg aag cag gca etc cga cga acc cat cgt 
val OPA gly tyr gly arg arg thr ala thr val lys gin ala leu arg arg thr his arg 
cy3 glu gly thr gly gly val arg gin arg OPA ser arg his 3er asp glu pro ile val 
val arg val arg ala ala tyr gly asn gly glu ala gly thr pro thr asn pro ser ser 
1501/501 

cac gtc gaa ggg gca ggt ga 
his val glu gly ala gly 
thr ser lys gly gin val 
arg arg arg gly arg OPA 



SEQ ID N° 15Q (suite 2) 
FIGURE 15Q (suite (2) 



- 31/11 

TGC GCA TGC CGA CCA GTG TGG TTG GCC GGA GTT CGT TTG TTC GCG ATT GCC TCA ACG ATT 
cys ala cys arg pro val trp leu ala gly val arg leu phe ala ile ala ser thr ile 
61/21 91/31 

CGA TAT AAC CAC TCT AGT CAC ATC AAC CAC ACT CGT ACC ATC GAG CGT GTG GGT TCA TGC 
arg tyr asn his ser ser his ile asn his thr arg thr ile glu arg val gly ser cys 
121/41 151/51 

CAT GCA TTC GCG ACC GCG GGA GCC GGC GAA CCC GGC GCC ACA CAT AAT CCA GAT TGA GGA 
his ala phe ala thr ala gly ala gly glu pro gly ala thr his asn pro asp OPA gly 
181/61 211/71 

GAC TTC CGT GCC GAA CCG ACG CCG ACG CAA GCT TTC GAC AGC CAT GAG CGC GGT CGC CGC 
asp phe arg ala glu pro thr pro thr gin ala phe asp ser his glu arg gly arg arg 
241/81 271/91 

CCT GGC AGT TGC AAG TCC TTG TGC ATA TTT TCT TGT CTA CGA ATC AAC CGA AAC GAC CGA 
pro gly ser cys lys ser leu cys ile phe ser cys leu arg ile asn arg asn asp arg 
301/101 331/111 

GCG GCC CGA GCA CCA TGA ATT CAA GCA GGC GGC GGT GTT GAC CGA CCT GCC CGG CGA GCT 

ala ala arg ala pro OPA ile gin ala gly gly gly val asp arg pro ala arg arg ala 

361/121 " 391/131 

GAT GTC CGC GCT ATC GCA GGG GTT GTC CCA GTT CGG GAT C 

asp val arg ala ile ala gly val val pro val arg asp 

SEQ ID N Q 16A 
FIGURE 16A 



FEU1LLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



57/185 



GCG CAT GCC GAC CAG TGT GGT 
ala his ala asp gin cys gly 
62/21 

GAT ATA ACC ACT CTA GTC ACA 
asp ile thr thr leu val thr 
122/41 

ATG CAT TCG CGA CCG CGG GAG 
met his ser arg pro arg glu 
182/61 

ACT TCC GTG CCG AAC CGA CGC 
thr ser val pro asn arg arg 
242/81 

CTG GCA GTT GGA AGT CCT TGT 
leu ala val ala ser pro cys 
302/101 

CGG CCC GAG CAC CAT GAA TTC 
arg pro glu his his glu phe 
362/121 

ATG TCC GCG CTA TCG CAG GGG 
met ser ala leu ser gin gly 









0£.f 0,1 




TGG 


CCG 


WW 






trp pro 


/win 

giu 


phe val 


cys 












TCA ACC 


ACA 


C1C GiA 


CCA 


ser 


thr 


thr 


leu val 


pro 








152/51 




CCG 


GCG 


AAC 


CCG GCG 


CCA 


pro 


ala 


asn 


pro ala 


pro 








CiCf 1 ± 




CGA 


CGC 


AAG 


CTT TCG 


ACA 


arg 


arg 


lys 


leu ser 


thr 








272/91 




GCA 


TAT 


TTT 


CTT GTC 


TAC 


ala 


tyr 


phe 


leu val 


tyr 








332/111 




AAG 


CAG 


GCG 


GCG GTG 


TTG 


lys gin 


ala 


ala val 


leu 








392/131 




TTG 


TCC 


CAG 


TCC GGG 


ATC 


leu 


ser 


gin 


phe gly 


ile 



SEQ ID N° 16B 
FIGURE 16B 



TCG CGA TTG CCT CAA CGA TTC 
ser arg leu pro gin arg phe 

TCG AGC GTG TGG GTT CAT GCC 
ser ser val trp val his ala 

CAC ATA ATC CAG ATT GAG GAG 
his ile ile gin ile glu glu 

GCC ATG AGC GCG GTC GCC GCC 
ala met ser ala val ala ala 

GAA TCA ACC GAA ACG ACC GAG 
glu ser thr glu thr thr glu 

ACC GAC CTG CCC GGC GAG CTG 
thr asp leu pro gly glu leu 



CGC ATG CCG ACC AGT GTG GTT 
arg met pro thr ser val val 
63/21 

ATA TAA CCA CTC TAG TCA CAT 
ile OCH pro leu AMB ser his 
123/41 

TGC ATT CGC GAC CGC GGG AGC 
cys ile arg asp arg gly ser 
183/61 

CTT CCG TGC CGA ACC GAC GCC 
leu pro cys arg thr asp ala 
243/81 

TGG CAG TTG CAA GTC CTT GTG 
trp gin leu gin val leu val 
303/101 

GGC CCG AGC ACC ATG AAT TCA 
gly pro ser thr met asn ser 
363/121 

TGT CCG CGC TAT CGC AGG GGT 
cys pro arg tyr arg arg gly 



33/11 

GGC CGG AGT TCG TTT GTT 
gly arg ser ser phe val 
93/31 

CAA CCA CAC TCG TAC CAT 
gin pro his ser tyr his 

153/51 
CGG CGA ACC CGG CGC CAC 
arg arg thr arg arg his 

213/71 
GAC GCA AGC TTT CGA CAG 
asp ala ser phe arg gin 

273/91 
CAT ATT TTC TTG TCT ACG 
his ile phe leu ser thr 

333/111 
AGC AGG CGG CGG TGT TGA 
ser arg arg arg cys OPA 

393/131 
TGT CCC AGT TCG GGA TC 
cys pro ser ser gly 

SEQ ID N° 16C 
FIGURE 16C 



CGC GAT TGC CTC AAC GAT TCG 
arg asp cys leu asn asp ser 

CGA GCG TGT GGG TTC ATG CCA 
arg ala cys gly phe met pro 

ACA TAA TCC AGA TTG AGG AGA 
thr OCH ser arg leu arg arg 

CCA TGA GCG CGG TCG CCG CCC 
pro OPA ala arg ser pro pro 

AAT CAA CCG AAA CGA CCG AGC 
asn gin pro lys arg pro ser 

CCG ACC TGC CCG GCG AGC TGA 
pro thr cys pro ala ser OPA 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



58/185 



31/11 

GCG GGC CAC CGA TCA GTC GAT CGG GTG GTT TCC GCT CCA TCA GCC CGG AAT TGA GGT GCC 
ala gly his arg ser val asp arg val val ser ala pro ser ala arg asn OPA gly ala 
61/21 91/31 

GCA GTG ACG ACA CCA GCG GAG GAC GCG CCG TTG GTG TTT CCC TCT GTT GCT TTC CCG TCC 
ala val thr thr pro ala gin asp ala pro leu val phe pro ser val ala phe pro ser 
121/41 151/51 

GGC TCG CCT TTT TTT CAT CAA CGT TGG ACT GCC GCA GTG GCG ATG TTG GTC GCC GGC GTG 
gly ser pro phe phe his gin arg trp thr ala ala val ala met leu val ala gly val 
181/61 211/71 

TTC GGT CAC CTG ACG GTC GGG ATG TTC CTT GGG TCT CGG GTT GCT GCT GGG TTT GCT CAA 
phe gly his leu thr val gly met phe leu gly ser arg val ala ala gly phe ala gin 
241/81 271/91 

TGC CCT GCT GGT GCG GCG TTC GGC CGA GTC GAT CAC CGC CAA AGA GCA CCC GTT AAA ACG 
cys pro ala gly ala ala phe gly arg val asp his arg gin arg ala pro val lys thr 
301/101 331/111 

GTC GAT GGC CCT CAA CTC GGC ATC GCG ACT GGC GAT TAT CAC CAT GCC TCG GGC TGA TC 
val asp gly pro gin leu gly ile ala thr gly asp tyr his his ala ser gly OPA 

SEQ ID H° 17A 
FIGURE 17A 















32/11 


















CGG GCC 


ACC 


GAT CAG 


TCG 


ATC GGG 


TGG TTT 


CCG CTC 


CAT 


CAG 


CCC 


GGA 


ATT 


GAG 


GTG 


CCG 


arg ala 


thr 


a3p gin 


ser 


ile gly trp phe 


pro leu 


his 


gin 


pro 


gly 


ile glu 


val 


pro 


62/21 












92/31 


















CAG TGA 


CGA 


CAC CAG 


CGC 


AGG ACG 


CGC CGT 


TGG TGT 


TTC 


CCT 


CTG 


TTG 


CTT 


TCC 


CGT 


CCG 


gin OPA arg his gin 


arg 


arg thr 


arg arg 


trp cys 


phe 


pro 


leu 


leu 


leu 


ser 


arg 


pro 


122/41 












152/51 


















GCT CGC 


CTT 


TTT TTC 


ATC 


AAC GTT 


GGA CTG 


CCG CAG 


TGG 


CGA 


TGT 


TGG 


TCG 


CCG 


GCG 


TGT 


ala arg leu phe phe ile 


asn val gly leu 


pro gin 


trp arg eys 


trp 


ser 


pro 


ala 


cys 


182/61 












212/71 


















TCG GTC 


ACC 


TGA CGG TCG 


GGA TGT 


TCC TTG 


GGT CTC 


GGG 


TTG 


CTG 


CTG 


GGT 


TTG 


CTC 


AAT 


ser val 


thr 


OPA arg 


ser 


gly cys 


ser leu 


gly leu 


gly leu leu leu gly leu leu 


asn 


242/81 












272/91 


















GCC CTG 


CTG 


GTG CGG 


CGT 


TCG GCC 


GAG TCG 


ATC ACC 


GCC 


AAA 


GAG 


CAC 


CCG 


TTA 


AAA 


CGG 


ala leu 


leu 


val arg 


arg 


ser ala 


glu ser 


ile thr 


ala 


lys 


glu his 


pro 


leu 


lys 


arg 


302/101 












332/111 


















TCG ATG 


GCC 


CTC AAC 


TCG 


GCA TCG 


CGA CTG 


GCG ATT 


ATC 


ACC 


ATG 


CCT 


CGG 


GCT 


GAT 


c 


ser met 


ala 


leu asn 


ser 


ala ser 


arg leu 


ala ile 


ile 


thr 


met 


pro 


arg 


ala 


asp 





SEQ ID N° 17B 
FIGURE 17B 



FEUILLE DE REMPLACEMENT (REGL.E 26) 



WO 99/09186 



PCI7FR98/018I3 



59/185 



33/11 

GGG CCA CCG ATC AGT CGA TCG GGT GGT TTC CGC TCC ATC AGC CCG GAA TTG AGG TGC CGC 
gly pro pro ile ser arg ser gly gly phe arg ser ile ser pro glu leu arg cys arg 
63/21 93/31 

AGT GAC GAC ACC AGC GCA GGA CGC GCC GTT GGT GTT TCC CTC TGT TGC TTT CCC GTC CGG 
ser asp asp thr ser ala gly arg ala val gly val ser leu cys cys phe pro val arg 
123/41 153/51 

CTC GCC TTT TTT TCA TCA ACG TTG GAC TGC CGC AGT GGC GAT GTT GGT CGC CGG CGT GTT 
leu ala phe phe ser ser thr leu, asp cys arg ser gly asp val gly arg arg arg val 
183/61 / 213/71 

CGG TCA CCT GAC GGT CGG GAT GTT CCT TGG GTC TCG GGT TGC TGC TGG GTT TGC TCA ATG 
arg ser pro asp gly arg asp val pro trp val ser gly cys cys trp val cys ser met 
243/81 273/91 

CCC TGC TGG TGC GGC GTT CGG CCG AGT CGA TCA CCG CCA AAG AGC ACC CGT TAA AAC GGT 
pro cys trp cys gly val arg pro ser arg ser pro pro lys ser thr arg OCH asn gly 
303/101 333/111 

CGA TGG CCC TCA ACT CGG CAT CGC GAC TGG CGA TTA TCA CCA TGC CTC GGG CTG ATC 
arg trp pro ser thr arg his arg asp trp arg leu ser pro cys leu gly leu ile 

SEQ ID N° 17C 
FIGURE 17C 



partie de la sequence nucleotidique de seg!7A 
1/1 ' 31/11 

ggc tag aac ccc gaa gga gac etc gcg ggt tgc egg ccc ccg gec cat egg atg cgt ate 
gly AMB asn pro glu gly asp leu ala gly cys arg pro pro ala his arg met arg ile 
61/21 91/31 

egg teg cgc cga ttc acg acc gac ata ggg age cac ccc ttg ggt gat tec ggt gcg acg 
arg ser arg arg phe thr thr asp ile gly ser cyr pro leu gly asp ser gly ala thr 
121/41 151/51 

act gcg ata cgc teg gcg gge cac cga tea gtc gat: egg gcg gtt tec get cca tea gec 
thr ala ile arg ser ala gly his arg ser val asp acg val val ser ala pro sec ala 
181/61 211/71 

egg aat tga ggt gec gca gtg acg aca cca gcg cag gac gcg ccg ttg gtg ttt ccc tct 
arg asn OPA gly ala ala val thr thr pro ala gin asp ala pro leu val phe pro ser 
241/81 ~ 271/91 

gtt get ttc egt ccg gtt cgc ctt ttt ttc ate aac gtt gga ctg gee gca gtg gcg atg 
val ala phe arg pro val arg leu phe phe ile asn val gly leu ala ala val ala met 
301/101 331/111 

ttg gtc gee ggc gtg ttc ggt cac ctg acg gtc ggg atg ttc ttg ggt etc ggg ttg ctg 
leu val ala gly val phe gly his leu thr val gly met; phe leu gly leu gly leu leu 
361/121 391/131 

ctg ggt ttg etc aat gec ctg ctg gtg egg cgc teg gee gag teg ate acc gee aaa gag 
leu gly leu leu asn ala leu leu val arg arg ser ala glu ser ile thr ala lys glu 
421/141 451/151 

cac ccg tta aaa egg teg atg gee etc aac teg gca teg cga ctg gcg att ate acc ate 
his pro leu lys arg ser met ala leu asn ser ala ser arg leu ala ile ile thr ile 
481/161 

etc ggg ctg ate 
leu gly leu lie 

SEQ ID N° 17A' 



FEUILLE DE REMplSHlll^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



60/185 



1/1 

get aga acc ccg aag gag acc teg egg gtt 
ala arg thr pro lys glu thr ser arg val 
61/21 

ggt cge gee gat tea cga ccg aca tag gga 
gly arg ala asp ser arg pro thr Wffl gly 
121/41 

etg ega tac get egg egg gee acc gat cag 
leu arg tyr ala arg arg ala thr asp gin 
181/61 

gga att gag gtg ecg cag tga cga cac cag 
gly ile glu val pro gin OPA arg his gin 
241/81 

ttg ctt tec gtc egg ttc gec ttt ttt tea 
leu leu ser val arg phe ala phe phe ser 
301/101 

tgg teg ccg gcg tgt teg gtc acc tga egg 
trp ser pro ala cys ser val thr OPA arg 
361/121 

tgg gtt tgc tea atg ccc tgc tgg tgc ggc 
trp val cys 3er met pro cya trp cys gly 
421/141 

acc cgt taa aac ggt cga tgg ccc tea act 
thr arg OCH asn gly arg trp pro ser thr 
481/161 

teg ggc tga tc 
3er gly opa 



31/11 

gee ggc ccc egg eec ate gga tgc gta tec 
ala gly pro arg pro ile gly cys val ser 
91/31 

get acc ect tgg gtg att ccg gtg cga cga 
ala thr pro trp val ile pro val arg arg 
151/51 

teg ate ggg tgg ttt ceg etc cat cag ccc 
ser ile gly trp phe pro leu his gin pro 
211/71 

cge agg acg cge cgt tgg tgt ttc cet etg 
arg arg thr arg arg trp cys phe pro leu 
271/91 

tea acg ttg gac tgg ccg cag tgg cga tgt 
ser thr leu asp trp pro gin trp arg cys 
331/111 

teg gga tgt tct tgg gtc teg ggt tgc tgc 
ser gly cy3 3er trp val ser gly cys cys 
391/131 

gtt egg ccg agt cga tea ccg cca aag age 
val arg pro ser arg ser pro pro lys aer 
451/151 

egg cat cge gac tgg cga tta tea cca tec 
arg his arg asp trp arg leu ser pro ser 



SEQ ID N a 17B» 
FIGURE 17B' 



1/1 31/U 

eta gaa ccc cga agg aga ect cge ggg ttg ccg gec ccc ggc cca teg gat gcg tat ccg 
leu glu pro arg arg arg pro arg gly leu pro ala pro gly pro 3er asp ala tyr pro 
61/21 91/31 

gtc gcg ccg att cac gac cga cat agg gag eta ccc ctt ggg tga ttc egg tgc gac gac 
val ala pro ile his asp arg his arg glu leu pro leu gly OPA phe arg cys a3p asp 
121/41 151/51 

tgc gat acg etc ggc ggg cca ccg ate agt cga teg ggt ggt ttc cge tec ate age ccg 
cys asp thr leu gly gly pro pro ile ser arg ser gly gly phe arg aer ile ser pro 
181/61 211/71 

gaa ttg agg tgc cge agt gac gac acc age gca gga egc gec gtt ggt gtt tec etc tgt 
glu leu arg cys arg ser asp asp thr aer ala gly arg ala val gly val ser leu cys 
241/81 271/91 

tgc ttt ccg tec ggt teg ect ttt ttt cat caa cgt tgg act ggc cge agt ggc gat gtt 
cys phe pro ser gly ser pro phe phe his gin arg trp thr gly arg ser gly asp val 
301/101 " 331/111 

ggt cge egg cgt gtt egg tea ect gac ggt egg gat gtt ctt ggg tet egg gtt get get 
gly arg arg arg val arg ser pro asp gly arg asp val leu gly ser arg val ala ala 
361/121 391/131 

ggg ttt get caa tgc ect get ggt gcg gcg ttc ggc cga gtc gat cac cge caa aga gca 
gly phe ala gin cys pro ala gly ala ala phe gly arg val asp his arg gin arg ala 
421/141 451/151 

ccc gtt aaa acg gtc gat ggc ect caa etc ggc ate gcg act ggc gat tat cac cat ect 

pro val lys thr val asp gly pro gin leu gly ile ala thr gly asp tyr his his pro 

491/161 

egg get gat c 

arg ala asp 



SEQ ID N° 17C 



FEUILLE DE REMtJ^ftEMBMl: (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



61/185 

^quence Rvl303 predite par Cole et al. (Nature 393:537-544) et contenant partiellement 
1/1 31/11 

atg acg aca cca gcg cag gac gcg ccg ttg gtg ttt ccc tct gtt get ttc cgt ccg gtt 
met thr thr pro ala gin asp ala pro leu val phe pro ser val ala phe arg pro val 
61/21 91/31 

cgc ctt ttt ttc ate aac gtt gga ctg gec gca gtg gcg atg ttg gtc gec ggc gtg ttc 
arg leu phe phe ile asn val gly leu ala ala val ala met leu val ala gly val phe 
121/41 151/51 

ggt cac ctg acg gtc ggg atg ttc ttg ggt etc ggg ttg ctg ctg ggt ttg etc aat gec 
gly his leu thr val gly met phe leu gly leu gly leu leu leu gly leu leu asn ala 
181/61 211/71 

ctg ctg gtg egg cgt teg gee gag teg ate ace gec aaa gag cac ccg tta aaa egg teg 
leu leu val arg arg ser ala glu ser ile thr ala lys glu his pro leu lys arg ser 
241/81 271/91 

atg gec etc aac teg gca teg cga ctg gcg att ate acc ate etc ggg ctg ate ate gec 
met ala leu asn ser ala ser arg leu ala ile ile thr ile leu gly leu ile ile ala 
301/101 331/111 

tac att ttc egg ccc get gga ttg ggc gtc gtg ttc ggg ctg gca ttc ttc cag gtg ctg 
tyr ile phe arg pro ala gly leu gly val val phe gly leu ala phe phe gin val leu 
361/121 391/131 

ctg gtg gca acg acg gec ctg ccg gtc ctg aag aag ctg cgc act gcg ace gag gaa ceg 
leu val ala thr thr ala leu pro val leu lys lys leu arg thr ala thr glu glu pro 
421/141 451/151 

gtc gca act tat tct tec aat ggc cag acc ggg gga teg gaa gga agg age gec age gat 
val ala thr tyr ser ser asn gly gin thr gly gly ser glu gly arg ser ala ser asp 
481/161 * 
gac tga 
asp OPA 

SEQ ID N° 17D 
FIGURE 17D 

Orf d'apres Cole et al. (Nature 393; 537-54 4) et contenant Rvl303 
1/1 31/11 

tga ggt gec gca gtg acg aca cca gcg cag gac gcg ccg ttg gtg ttt ccc tct gtt get 
OPA gly ala ala val thr thr pro ala gin asp ala pro leu val phe pro ser val ala 
61/21 91/31 

ttc cgt ccg gtt cgc ctt ttt ttc ate aac gtt gga ctg gec gca gtg gcg atg ttg gtc 
phe arg pro val arg leu phe phe ile asn val gly leu ala ala val ala met leu val 
121/41 151/51 

gee ggc gtg ttc ggt cae ctg acg gtc ggg atg ttc ttg ggt etc ggg ttg ctg ctg ggt 
ala gly val phe gly his leu thr val gly met phe leu gly leu gly leu leu leu gly 
181/61 211/71 

ttg etc aat gec ctg ctg gtg egg cgt teg gec gag teg ate acc gec aaa gag cac ccg 
leu leu asn ala leu leu val arg arg ser ala glu ser ile thr ala lys glu his oro 
241/81 271/91 

tta aaa egg teg atg gec etc aac teg gca teg cga ctg gcg att ate acc ate etc ggg 
leu lys arg ser met ala leu asn ser ala ser arg leu ala ile ile thr ile leu alv 
301/101 331/111 9 Y 

ctg ate ate gec tac. att ttc egg cec get gga ttg ggc gtc gtg ttc ggg ctg gca ttc 
leu ile ile ala tyr ile phe arg pro ala gly leu gly val val phe gly leu ala phe 
361/121 391/131 

ttc cag gtg ctg ctg gtg gca acg acg gec ctg ccg gtc ctg aag aag ctg cgc act gcg 
phe gin val leu leu val ala thr thr ala leu pro val leu lys lys leu arg thr ala 
421/141 451/151 

acc gag gaa ccg gtc gca act tat tct tec aat ggc cag acc ggg gga teg gaa gga agg 
thr glu glu pro val ala thr tyr ser ser asn gly gin thr gly gly ger glu gly arg 
481/161 * y y 

age gec age gat gac tga 
ser ala 3er asp asp OPA 

SEQ ID N° 17F 



FEUILLE DE RENff*l3HJB\/lBNT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



62/185 



GTC GAA CAG GTA CGG AAG GCG CCG TCG GTC 
val glu gin val arg lys ala pro ser val 
61/21 

AGC CAG CGG CCG TTA ACG TGG CCG AAC AGG 
ser gin arg pro leu thr trp pro asn arg 
121/41 

TGG CTC AGG TCG ATA CCC GAG GGG ATG GCA 
trp leu arg ser ile pro glu gly met ala 
181/61 

TCG GGT GCA ACG ATC GGG CCA TGC CTG ACG 
ser gly ala thr ile gly pro cys leu thr 
241/81 

ATG CGG AAG ACG ACT CGC GGC CCG ACG CCG 
met arg lys thr thr arg gly pro thr pro 
301/101 

CAG CCG GTC CCG ATG TTC TCG ACC TAC GGT 
gin pro val pro met phe ser thr tyr gly 
361/121 

GTC GCC GCG GTC GTG CTG GGT GCG ATG ATC 
val ala ala val val leu gly ala met ile 



31/11 



GCT CGG TCC GCT GGT 


ATC 


TCG 


TGT 


TCA 


GCC 


ala arg ser ala gly 


ile 


ser 


cys 


Ser 


ala 


91/31 










TCG TCT TGG GGT CGG 


GCA TCA 


GCG 


TCG 


ATG 


ser ser trp gly arg 


ala 


ser 


ala 


ser 


met 


± J -L/ D J. 












AGT GTC ACC CCG CCA 


TCC 


TTC 


CAC 


CTC 


TTT 


ser val thr pro pro 


ser 


phe 


his 


leu 


phe 


211/71 








GGG AGC AGA GCC AGC 


CAC 


CGG 


CCC 


AAG 


AAG 


gly ser arg ala ser 


his 


arg 


pro 


lys 


lys 


271/91 








CGG AGG CCG CCG CGG 


CCG 


AAC 


CCA 


AAT 


CAT 


arg arg pro pro arg 


pro 


asn 


pro 


asn 


his 


331/111 










ATC GCC TCG ACA CTA 


CTC 


GGC 


GTG 


CTA 


TCG 


ile ala ser thr leu 


leu gly 


val 


leu 


ser 



SEQ ID N° 18A 

FIGURE 18A 



















32/11 


















TCG AAC 


AGG 


TAC 


GGA AGG 


CGC 


CGT CGG 


TCG 


CTC GGT 


CCG 


CTG 


GTA 


TCT 


CGT 


GTT 


CAG 


CCA 


ser asn 
62/21 


arg 


tyr gly arg 


arg 


arg arg 


ser 


leu gly 
92/31 


pro 


leu 


val 


ser 


arg 


val 


gin 


pro 


GCC AGC 


GGC 


CGT 


TAA 


CGT 


GGC 


CGA ACA 


GGT 


CGT CTT 


GGG 


GTC 


GGG 


CAT 


CAG 


CGT 


CGA 


TGT 


ala ser 
122/41 


gly 


arg 


OCH 


arg 


gly arg thr 


giy 


arg leu 
152/51 


gly val gly 


his 


gin 


arg 


arg 


cys 


GGC TCA 


GGT 


CGA 


TAC 


CCG 


AGG 


GGA TGG 


CAA 


GTG TCA 


CCC 


CGC 


CAT 


CCT 


TCC 


ACC 


TCT 


TTT 


gly ser 
182/61 


giy 


arg tyr pro 


arg gly trp 


gin 


val ser 
212/71 


pro 


arg 


his 


pro 


ser 


thr 


ser 


phe 


CGG GTG 


CAA 


CGA 


TCG 


GGC 


CAT 


GCC TGA 


CGG 


GGA GCA 


GAG 


CCA 


GCC 


ACC 


GGC 


CCA 


AGA 


AGA 


arg val 
242/81 


gin 


arg 


ser 


gly 


his 


ala OPA 


arg 


gly ala 
272/91 


glu pro 


ala 


thr gly 


pro 


arg 


arg 


TGC GGA 


AGA 


CGA 


CTC 


GCG 


GCC 


CGA CGC 


CGC 


GGA GGC 


CGC 


CGC 


GGC 


CGA ACC 


CAA 


ATC 


ATC 


cys gly 
302/101 


arg 


arg 


leu 


ala 


ala 


arg arg 


arg 


gly gly 
332/111 


arg 


arg gly 


arg 


thr 


gin 


ile 


ile 


AGC CGG 


TCC 


CGA 


TGT 


TCT 


CGA 


CCT ACG 


GTA 


TCG CCT 


CGA 


CAC 


TAC 


TCG 


GCG 


TGC 


TAT 


CGG 


ser arg 
362/121 


ser 


arg 


cys 


ser 


arg 


pro thr 


val 


ser pro 


arg 


his 


tyr 


ser 


ala 


cys 


tyr 


arg 


TCG CCG 


CGG 


TCG 


TGC 


TGG 


GTG 


CGA TGA 


TC 




















ser pro 


arg 


ser 


cys 


trp 


val 


arg OPA 























SEQ ID N° 18B 



FIGURE 18B 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



63/185 



3/1 

CGA ACA GGT ACG GAA GGC GCC GTC GGT CGC 
arg thr gly thr glu gly ala val gly arg 
63/21 

CCA GCG GCC GTT AAC GTG GCC GAA CAG GTC 
pro ala ala val asn val ala glu gin val 
123/41 

GCT CAG GTC GAT ACC CGA GGG GAT GGC AAG 
ala gin val asp thr arg gly asp gly lys 
183/61 

GGG TGC AAC GAT CGG GCC ATG CCT GAC GGG 
gly cys asn asp arg ala met pro asp gly 
243/81 

GCG GAA GAC GAC TCG CGG CCC GAC GCC GCG 
ala glu asp asp ser arg pro asp ala ala 
303/101 

GCC GGT CCC GAT GTT CTC GAC CTA CGG TAT 
ala gly pro asp val leu asp leu arg tyr 
363/121 

CGC CGC GGT CGT GCT GGG TGC GAT GAT C 
arg arg gly arg ala gly cys asp asp 



33/11 

TCG GTC CGC TGG TAT CTC GTG TTC AGC CAG 
ser val arg trp tyr leu val phe ser gin 
93/31 

GTC TTG GGG TCG GGC ATC AGC GTC GAT GTG 
val leu gly ser gly ile ser val asp val 
153/51 

TGT CAC CCC GCC ATC CTT CCA CCT CTT TTC 
cys his pro ala ile leu pro pro leu phe 
213/71 

GAG CAG AGC CAG CCA CCG GCC CM GAA GAT 
glu gin ser gin pro pro ala gin glu asp 
273/91 

GAG GCC GCC GCG GCC GAA CCC AAA TCA TCA 
glu ala ala ala ala glu pro lys ser ser 
333/111 

CGC CTC GAC ACT ACT CGG CGT GCT ATC GGT 
arg leu asp thr thr arg arg ala ile gly 



SEQ ID N° 18C 
FIGURE 18C 



partie de la sequence nucleotidique de seq!9A 
1/1 31/11 



GAA GGC 


GCC 


GTC 


GGT CGC 


TCG 


GTC 


CGC 


TGG 


TAT CTC 


GTG 


TTC 


AGC 


CAG CCA GCG 


GCC 


GTT 


glu gly 


ala 


val 


gly arg 


ser 


val 


arg 


trp 


tyr leu 


val 


phe 


ser 


gin pro ala 


ala 


val 


61/21 
















91/31 














AAC GTG 


GCC 


GAA 


CAG GTC 


GTC 


TTG 


GGG 


TCG 


GGC ATC 


AGC 


GTC 


GAT 


GTG GCT CAG 


GTC 


GAT 


asn val 


ala 


glu 


gin val 


val 


leu gly 


ser gly ile 


ser 


val 


asp 


val ala gin val 


asp 


121/41 
















151/51 














ACC CGA 


GGG 


GAT 


GGC AAG 


TGT 


CAC 


CCC 


GCC 


ATC CTT 


CCA 


CCT 


CTT 


TTC GGG TGC 


AAC 


GAT 


thr arg 


gly 


asp 


gly lys 


cys 


his 


pro 


ala 


ile leu 


pro 


pco 


leu phe gly cys 


asn 


asp 


181/61 
















211/71 














CGG GCC 


ATG 


CCT 


GAC GGG 


GAG 


CAG 


AGC 


CAG 


CCA CCG 


GCC 


CAA 


GAA 


GAT GCG GAA 


GAC 


GAC 


arg ala 


met 


pro 


asp gly 


glu gin 


ser 


gin pro pro 


ala gin glu asp ala glu 


asp 


asp 


241/81 
















271/91 














TCG CGG 


CCC 


GAC 


GCC GCG 


GAG 


GCC 


GCC 


GCG 


GCC GAA 


CCC 


AAA 


TCA 


TCA GCC GGT 


CCG 


ATG 


ser arg 


pro 


asp 


ala ala 


glu ala 


ala 


ala 


ala glu 


pro lys 


ser 


ser ala gly pro met 


301/101 
















331/111 














TTC TCG 


ACC 


TAG 


GGT ATC 


GCC 


TCG 


ACA 


CTA 


CTC GGC 


GTG 


CTA 


TCG 


GTC GCC GCG 


GTC 


GTG 


phe ser 


thr 


tyr 


gly ile 


ala 


ser 


thr 


leu 


leu gly 


val 


leu 


ser 


val ala ala 


val 


val 


361/121 






























CTG GGT 


GCG 


ATG 


ATC 
























leu gly 


ala 


met 


ile 

























SEQ ID N° ISA' 
FIGURE 18A' 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



64/185 



1/1 

CGG AAG GCG CCG TCG GTC GCT CGG TCC GCT 
arg lys ala pro ser val ala arg ser ala 
61/21 

TTA ACG TGG CCG AAC AGG TCG TCT TGG GGT 
leu thr trp pro asn arg ser ser trp gly 
121/41 

ATA CCC GAG GGG ATG GCA AGT GTC ACC CCG 
ile pro glu gly met ala ser val thr pro 
181/61 

ATC GGG CCA TGC CTG ACG GGG AGC AGA GCC 
ile gly pro cys leu thr gly ser arg ala 
241/81 

ACT CGC GGC CCG ACG CCG CGG AGG CCG CCG 
thr arg giy pro thr pro arg arg pro pro 
301/101 

TGT TCT CGA CCT ACG GTA TCG CCT CGA CAC 
cys ser arg pro thr val ser pro arg his 
361/121 

TGC TGG GTG CGA TGA TC 
cys trp val arg OPA 



31/11 

GGT ATC TCG TGT TCA GCC AGC CAG CGG CCG 
gly ile ser cys ser ala ser gin arg pro 
91/31 

CGG GCA TCA GCG TCG ATG TGG CTC AGG TCG 
arg ala ser ala ser met trp leu arg ser 
151/51 

CCA TCC TTC CAC CTC TTT TCG GGT GCA ACG 
pro ser phe his leu phe ser gly ala thr 
211/71 

AGO CAC CGG CCC AAG AAG ATG CGG AAG ACG 
ser his arg pro lys lys met arg lys thr 
271/91 

CGG CCG MC CCA AAT CAT CAG CCG GTC CGA 
arg pro asn pro asn his gin pro val arg 
331/111 

TAC TCG GCG TGC TAT CGG TCG CCG CGG TCG 
tyr ser ala cys tyr arg ser pro arg ser 



SEQ ID N° 18B' 
FIGURE 18B' 



1/1 31/11 

GGA AGG CGC CGT CGG TCG CTC GGT CCG CTG GTA TCT CGT GTT CAG CCA GCC AGC GGC CGT 
gly arg arg arg arg ser leu gly pro leu val ser arg val gin pro ala ser gly arg 
61/21 91/31 

TAA CGT GGC CGA ACA GGT CGT CTT GGG GTC GGG CAT CAG CGT CGA TGT GGC TCA GGT CGA 
OCH arg gly arg thr gly arg leu gly val gly his gin arg arg cys gly ser gly arg 
121/41 151/51 

TAC CCG AGG GGA TGG CAA GTG TCA CCC CGC CAT CCT TCC ACC TCT TTT CGG GTG CAA CGA 
tyr pro arg gly trp gin val ser pro arg his pro ser thr ser phe arg val gin arg 
181/61 211/71 

TCG GGC CAT GCC TGA CGG GGA GCA GAG CCA GCC ACC GGC CCA AGA AGA TGC GGA AGA CGA 
ser gly his ala OPA arg gly ala glu pro ala thr gly pro arg arg cys gly arg arg 
241/81 271/91 

CTC GCG GCC CGA CGC CGC GGA GGC CGC CGC GGC CGA ACC CAA ATC ATC AGC CGG TCC GAT 
leu ala ala arg arg arg gly gly arg arg gly arg thr gin ile ile ser arg ser asp 
301/101 331/111 

GTT CTC GAC CTA CGG TAT CGC CTC GAC ACT ACT CGG CGT GCT ATC GGT CGC CGC GGT CGT 
val leu asp leu arg tyr arg leu asp thr thr arg arg ala ile gly arg arg gly arg 
361/121 

GCT GGG TGC GAT GAT C 
ala gly cys asp asp 

SEQ ID N° 18C 
FIGURE 18C 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



65/185 



sequence Rv0199 predite par Cole et al. {Nature 393:537-544) et contenant 
seqlBA 1 

1/1 31/11 

atg cct gac ggg gag cag age cag cca ccg gec caa gaa gat gcg gaa gac gac teg egg 
Met pro asp gly glu gin ser gin pro pro ala gin glu asp ala glu asp asp ser arg 
61/21 91/31 

ccc gac gec gcg gag gec gec gcg gec gaa ccc aaa tea tea gee ggt ccg atg ttc teg 
pro asp ala ala glu ala ala ala ala glu pro lys ser ser ala gly pro met phe ser 
121/41 151/51 

ace tac ggt ate gec teg aca eta etc ggc gtg eta teg gtc gec gcg gtc gtg ctg ggt 
thr tyr gly ile ala ser thr leu leu gly val leu ser val ala ala val val leu gly 
181/61 211/71 

gcg atg ate tgg tec gca cac cgc gat gac tec ggc gag cgt ace tac ctg acc egg gtc 
ala met ile trp set ala his arg asp asp ser gly glu arg thr tyr leu thr arg val 
241/81 271/91 

atg ctg acc gec get gaa tgg acg gee gtg ctg ate aac atg aac gee gac aac ate gat 
met leu thr ala ala glu trp thr ala val leu ile asn met asn ala asp asn ile asp 
301/101 331/111 

gee age ctg cag cga ctg cac gac gga acg gtc ggt caa etc aac ace gac ttc gac get 
ala ser leu gin arg leu his asp gly thr val gly gin leu asn thr asp phe asp ala 
361/121 391/131 

gtc gtg cag cce tac egg cag gtg gtg gag aag ttg egg acg cac age age ggc agg ate 
val val gin pro tyr arg gin val val glu lys leu arg thr his ser ser gly arg ile 
421/141 451/151 

gag gcg gta gcg ate gat acg gtg cac cgc gag ctg gat acc cag tec ggt gec gee cga 
glu ala val ala ile asp thr val his arg glu leu asp thr gin ser gly ala ala arg 
481/161 . 511/171 

ccg gta gta acc acg aaa ttg cca ccg ttt gec act cgc acc gac teg gtg etg ctg gtc 
pro val val thr thr lys leu pro pro phe ala thr arg thr asp ser val leu leu val 
541/181 571/191 

gcg acg teg gtc agt gag aac gec ggc gee aaa ccc cag acc gtg cac tgg aac ttg egg 
ala thr ser val ser glu asn ala gly ala lys pro gin thr val his trp asn leu arg 
601/201 631/211 

etc gat gtc tec gat gtg gac ggc aag ctg atg ate tec egg ttg gag teg att cga tga 
leu asp val ser asp val asp gly lys leu met ile ser arg leu glu ser ile arg OPA 



SEQ ID N° 18D 
FIGURE 18D 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



66/185 



ORF d'apres Cole et aL (Nature 393:537-544) et contenant Rv0199 
1/1 31/11 

taa tec gat gec gga ttg ggt gaa atg cac caa gta acg ggt cga gtc ttt gga ate ggt 
OCH ser asp ala gly leu gly glu met his gin val thr gly arg val phe gly ile gly 
61/21 91/31 

ate gac ata gac tec gat gec gee gec cac gec ggc acg ttg cag agt gec aag ggc ggc 
ile asp ile asp ser asp ala ala ala his ala gly thr leu gin ser ala lys gly gly 
121/41 151/51 

ggc caa ttc ggt ggc gtc ggc cgc get gtc aat cgt ggc caa ttc gtc gtg cag egg ttg 
gly gin phe gly gly val gly arg ala val asn arg gly gin phe val val gin arc* leu 
181/61 211/71 

cac ccc tgc gcg etc gac ggc ttc etc gtc gag gaa get ggc gta gag gtc gec gat gcg 
his pro cys ala leu asp gly phe leu val glu glu ala gly val glu val ala asp ala 
241/81 271/91 F 

ctg cgc ate ggt gee tac cgc age acc tgc ttg get ggc ctg gat gat cag gtc teg cac 
leu arg ile gly ala tyr arg ser thr cys leu ala gly leu asp asp gin val ser his 
^01/101 331/111 

ttg tgt etc ggc gcg gtc gaa cag get acg gaa ggc gec gtc ggt cgc teg gtc cgc tgg 
leu cys leu gly ala val glu gin ala thr glu gly ala val gly arg ser val arg trp 
361/121 391/131 * P 

tat etc gtg ttc age cag cca gcg gee gtt aac gtg gee gaa cag gtc gtc ttg ggg teg 
tyr leu val phe ser gin pro ala ala val asn val ala glu gin val val leu gly ser 
421/141 451/151 

ggc ate age gtc gat gtg get cag gtc gat acc cga ggg gat ggc aag tgt cac ccc gec 
gly ile ser val asp val ala gin val asp thr arg gly asp gly lys cys his pro ala 
461/161 511/171 

ate Ctt cca cct ctt ttc ggg tgc aac gat egg gec atg cct gac ggg gag cag age cag 
xle leu pro pro leu phe gly cys asn asp arg ala met pro asp gly glu gin ser gin 
541/181 571/191 

cca ccg gee caa gaa gat gcg gaa gac gac teg egg ccc gac gee gcg gag gec gee gcg 
pro pro ala gin glu asp ala glu asp asp ser arg pro asp ala ala glu ala ala ala 
601/201 631/211 

gec gaa ccc aaa tea tea gec ggt ccg atg ttc teg acc tac ggt ate gee teg aca eta 
ala glu pro lys ser ser ala gly pro met phe ser thr tyr gly ile ala ser thr leu 
661/221 691/231 

etc ggc gtg eta teg gtc gec gcg gtc gtg ctg ggt gcg atg ate tgg tec gca cac cgc 
leu gly val leu ser val ala ala val val leu gly ala met ile trp ser ala his are 
721/241 751/251 

gat gac tec ggc gag cgt acc tac ctg ace egg gtc atg ctg acc gec get gaa tgg acg 
asp asp ser gly glu arg thr tyr leu thr arg val met leu thr ala ala glu trp thr 
781/261 811/271 

gec gtg ctg ate aac atg aac gec gac aac ate gat gee age ctg cag cga ctg cac gac 
ala val leu ile asn met asn ala asp asn ile asp ala ser leu gin arg leu his asp 
841/281 871/291 

gga acg gtc ggt caa etc aac acc gac tte gac get gtc gtg cag ccc tac egg cag gtg 
gly thr val gly gin leu a3n thr asp phe asp ala val val gin pro tyr arg gin val 
901/301 931/311 

gtg gag aag ttg egg acg cac age age ggc agg ate gag gcg gta gcg ate gat acg gtg 
val glu lys leu arg thr his ser sec gly arg ile glu ala val ala ile asp thr val 
961/321 991/331 

cac cgc gag ctg gat acc cag tec ggt gec gee cga ccg gta gta acc acg aaa ttg cca 
his arg glu leu asp thr gin ser gly ala ala arg pro val val thr thr lys leu pro 
1021/341 1051/351 

ccg ttt gee act cgc acc gac teg gtg ctg ctg gtc gcg acg teg gtc agt gag aac gec 
pro phe ala thr arg thr asp ser val leu leu val ala thr ser val ser glu asn ala 
1081/361 1111/371 

ggc gec aaa ccc cag acc gtg cac tgg aac ttg egg etc gat gtc tec gat gtg gac ggc 
gly ala ly3 pro gin thr val his trp asn leu arg leu asp val ser aso val a3p qlv 
1141/381 1171/391 * 

aag ctg atg ate tec egg ttg gag teg att cga tga 
ly3 leu met ile ser arg leu glu ser ile arg OPA 



SEQ ID N° 18F 



FIGURE 18F 
FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



67/185 



31/11 

GTT GCG CAA CGG GGT GAG CAC CGA CGC GAT GAT GGC GCA ACT ATC GAA ACT GCA GGA CAT 
val ala gin arg gly glu his arg arg asp asp gly ala thr ile glu thr ala gly his 
61/21 91/31 

CGC CAA CGC CAA CGA CGG CAC TCG CGC GGT GGG CAC CCC TGG CTA TCA GGC CAG CGT CGA 
arg gin arg gin arg arg his ser arg gly gly his pro trp leu ser gly gin arg arg 
121/41 151/51 

CTA TGT GGT AAA CAC ACT GCG CAA CAG CGG TTT TGA TGT GCA AAC CCC GGA GTT CTC CGC 
leu cys gly lys his thr ala gin gin arg phe OPA cys ala asn pro gly val leu arg 
181/61 211/71 

TCG CGT GTT CAA GGC CGA AAA AGG GGT GGT GAC CCT CGG CGG CAA CAC CGT GGA GGC GAG 
ser arg val gin gly arg lys arg gly gly asp pro arg arg gin his arg gly gly glu 
241/81 271/91 

GGC GCT CGA GTA CAG CCT CGG CAC ACC GCC GGA CGG GGT GAC GGG CCC GCT GGT GGC TGC 
gly ala arg val gin pro arg his thr ala gly arg gly asp gly pro ala gly gly cys 
301/101 331/111 

CCC CGC CGA CGA CAG TCC GGG CTG CAG TCC GTC GGA CTA CGA CAG GCT GCC GGT GTC CGG 
pro arg arg arg gin ser gly leu gin ser val gly leu arg gin ala ala gly val arg 
361/121 

TGC GGT GGT GCT GGT AGA TC 
cys gly gly ala gly arg 

/ 

SEQ ID N° 19A 
FIGURE 19A 



32/11 

TTG CGC AAC GGG GTG AGC ACC GAC GCG ATG ATG GCG CAA CTA TCG AAA CTG CAG GAC ATC 
leu arg asn .gly val ser thr asp ala met met ala gin leu ser lys leu gin asp ile 
62/21 92/31 

GCC AAC GCC AAC GAC GGC ACT CGC GCG GTG GGC ACC CCT GGC TAT CAG GCC AGC GTC GAC 
ala asn ala asn asp gly thr arg ala val gly thr pro gly tyr gin ala ser val asp 
122/41 152/51 

TAT GTG GTA AAC ACA CTG CGC AAC AGC GGT TTT GAT GTG CAA ACC CCG GAG TTC TCC GCT 
tyr val val asn thr leu arg asn ser gly phe asp val gin thr pro glu phe ser ala 
182/61 212/71 

CGC GTG TTC AAG GCC GAA AAA GGG GTG GTG ACC CTC GGC GGC AAC ACC GTG GAG GCG AGG 
arg val phe lys ala glu lys gly val val thr leu gly gly asn thr val glu ala arg 
242/81 272/91 

GCG CTC GAG TAC AGC CTC GGC ACA CCG CCG GAC GGG GTG ACG GGC CCG CTG GTG GCT GCC 
ala leu glu tyr ser leu gly thr pro pro asp gly val thr gly pro leu val ala ala 
302/101 332/111 

CCC GCC GAC GAC AGT CCG GGC TGC AGT CCG TCG GAC TAC GAC AGG CTG CCG GTG TCC GGT 
pro ala aso aso ser pro gly cys ser pro ser asp tyr asp arg leu pro val ser gly 
362/121 

GCG GTG GTG CTG GTA GAT C 
ala val val leu val asp 



SEQ ID N° 19B 
FIGURE 19B 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCI7FR98/01813 



68/185 



















33/11 












TGC GCA ACG 


GGG 


TGA 


GCA 


CCG 


ACG CGA 


TGA 


TGG CGC 


AAC 


TAT 


CGA AAC TGC AGG ACA TCG 


cys ala 


thr 


gly OPA ala pro thr arg 


OPA 


trp arg 


asn 


tyr arg 


asn cys arg 


thr ser 


63/21 
















93/31 












CCA ACG 


CCA 


ACG 


ACG 


GCA 


CTC 


GCG CGG 


TGG 


GCA CCC 


CTG 


GCT 


ATC 


AGG CCA GCG 


TCG ACT 


pro thr 


pro 


thr 


thr 


ala 


leu 


ala arg 


trp 


ala pro 


leu 


ala 


ile 


arg pro ala 


ser thr 


123/41 
















153/51 












ATG TGG 


TAA 


ACA 


CAC 


TGC 


GCA 


ACA GCG 


GTT 


TTG ATG 


TGC 


AAA 


CCC 


CGG AGT TCT 


CCG CTC 


met trp 


OCH 


thr 


his 


cys 


ala 


thr ala 


val 


leu met 


cys 


lys 


pro 


arg ser ser 


pro leu 


183/61 
















213/71 












GCG TGT 


TCA 


AGG 


CCG AAA AAG 


GGG TGG 


TGA 


CCC TCG 


GCG 


GCA ACA 


CCG TGG AGG 


CGA GGG 


ala cys 


ser 


arg 


pro 


lys 


lys 


gly trp 


OPA 


pro ser 


ala 


ala 


thr 


pro trp arg 


arg gly 


243/81 
















273/91 












CGC TCG AGT 


ACA 


GCC 


TCG 


GCA 


CAC CGC 


CGG 


ACG GGG 


TGA 


CGG 


GCC 


CGC TGG TGG 


CTG CCC 


arg ser 


ser 


thr 


ala 


ser 


ala 


his arg 


arg 


thr gly 


OPA 


arg 


ala 


arg trp trp 


leu pro 


303/101 
















333/111 












CCG CCG ACG 


ACA 


GTC 


CGG 


GCT 


GCA GTC 


CGT 


CGG ACT 


ACG 


ACA 


GGC 


TGC CGG TGT 


CCG GTG 


pro pro 


thr 


thr 


val 


arg 


ala 


ala val 


arg 


arg thr 


thr 


thr 


gly cys arg cys 


pro val 



363/121 
CGG TGG TGC TGG TAG ATC 
arg trp cys trp AMB ile 



SEQ ID N p 19C 
FIGURE 19C 



partie de la sequence nucleotidique de seq!9A 



1/1 31/11 



CTA TCG AAA 


CTG 


CAG 


GAC 


ATC 


GCC 


AAC 


GCC 


AAC GAC GGC 


ACT 


CGC 


GCG 


GTG GGC 


ACC CCT 


leu ser lys 


leu 


gin 


asp 


ile 


ala 


asn 


ala 


asn asp gly thr arg 


ala 


val gly thr pro 


61/21 
















91/31 












GGC TAT CAG 


GCC 


AGC 


GTC 


GAC 


TAT 


GTG 


GTA 


AAC ACA CTG 


CGC 


AAC 


AGC 


GGT TTT 


GAT GTG 


gly tyr gin 


ala 


ser 


val 


asp 


tyr val 


val 


asn thr leu 


arg 


asn 


ser 


gly phe asp val 


121/41 
















151/51 












CAA ACC CCG 


GAG 


TTC 


TCC 


GCT 


CGC 


GTG 


TTC 


AAG GCC GAA 


AAA 


GGG 


GTG 


GTG ACC 


CTC GGC 


gin thr pro 


glu 


phe 


ser 


ala 


arg 


val 


phe 


lys ala glu 


lys 


gly val 


val thr 


leu gly 


181/61 
















211/71 












GGC AAC ACC 


GTG 


GAG 


GCG 


AGG 


GCG 


CTC 


GAG 


TAC AGC CTC 


GGC 


ACA 


CCG 


CCG GAC 


GGG GTG 


gly asn thr 


val 


glu 


ala 


arg 


ala 


leu 


glu 


tyr ser leu 


giy 


thr 


pro 


pro asp 


gly val 


241/81 
















271/91 












ACG GGC CCG 


CTG 


GTG 


GCT 


GCC 


CCC 


GCC 


GAC 


GAC AGT CCG 


GGC 


TGC 


AGT 


CCG TCG 


GAC TAC 


thr gly pro 


leu 


val 


ala 


ala 


pro 


ala 


asp 


asp ser pro 


gly cys 


ser 


pro ser 


asp tyr 


301/101 
















331/111 












GAC AGG CTG 


CCG 


GTG 


TCC 


GGT 


GCG 


GTG 


GTG 


CTG GTA GAT 


c 










asp arg leu 


pro 


val 


ser 


gly 


ala 


val 


val 


leu val asp 













SEQ ID N° 19A' 
FIGURE 19A 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



69/185 



1/1 31/11 

TAT CGA AAC TGC AGG ACA TCG CCA ACG CCA ACG ACG GCA CTC GCG CGG TGG GCA CCC CTG 
tyr arg asn cys arg thr ser pro thr pro thr thr ala leu ala arg trp ala pro leu 
61/21 91/31 

GCT ATC AGG CCA GCG TCG ACT ATG TGG TAA ACA CAC TGC GCA ACA GCG GTT TTG ATG TGC 
ala ile arg pro ala ser thr met trp OCH thr his cys ala thr ala val leu met cys 
121/41 151/51 

AAA CCC CGG AGT TCT CCG CTC GCG TGT TCA AGG CCG AAA AAG GGG TGG TGA CCC TCG GCG 
lys pro arg ser ser pro leu ala cys ser arg pro ly3 lys gly trp OPA pro ser ala 
181/61 211/71 

GCA ACA CCG TGG AGG CGA GGG CGC TCG AGT ACA GCC TCG GCA CAC CGC CGG ACG GGG TGA 
ala thr pro trp arg arg gly arg ser ser thr ala ser ala his arg arg thr gly OPA 
241/81 271/91 

CGG GCC CGC TGG TGG CTG CCC CCG CCG ACG ACA GTC CGG GCT GCA GTC CGT CGG ACT ACG 
arg ala arg trp trp leu pro pro pro thr thr val arg ala ala val arg arg thr thr 
301/101 " 331/111 

ACA GGC TGC CGG TGT CCG GTG CGG TGG TGC TGG TAG ATC 
thr gly cys arg cys pro val arg trp cys trp AMB ile 

SEQ ID N° 19B' 
FIGURE 19B f 



1/1 ' 31/11 

ATC GAA ACT GCA GGA CAT CGC CAA CGC CAA CGA CGG CAC TCG CGC GGT GGG CAC CCC TGG 
ile glu thr ala gly his arg gin arg gin arg arg his ser arg gly gly his pro trp 
61/21 91/31 

CTA TCA GGC CAG CGT CGA CTA TGT GGT AAA CAC ACT GCG CAA CAG CGG TTT TGA TGT GCA 
leu ser gly gin arg arg leu cys gly lys his thr ala gin gin arg phe OPA cys ala 
121/41 151/51 

AAC CCC GGA GTT CTC CGC TCG CGT GTT CAA GGC CGA AAA AGG GGT GGT GAC CCT CGG CGG 
asn pro gly val leu arg ser arg val gin gly arg lys arg gly gly asp pro arg arg 
181/61 211/71 

CAA CAC CGT GGA GGC GAG GGC GCT CGA GTA CAG CCT CGG CAC ACC GCC GGA CGG GGT GAC 
gin his arg gly gly glu gly ala arg val gin pro arg his thr ala gly arg gly asp 
241/81 271/91 

GGG CCC GCT GGT GGC TGC CCC CGC CGA CGA CAG TCC GGG CTG CAG TCC GTC GGA CTA CGA 
gly pro ala gly gly cys pro arg arg arg gin ser gly leu qln ser val gly leu arg 
301/101 331/111 
CAG GCT GCC GGT GTC CGG TGC GGT GGT GCT GGT AGA TC 
gin ala ala gly val arg cys gly gly ala gly arg 
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FIGURE 19C 
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sequence Rv0418 predite par Cole et 
seql9A' 

1/1 

atg aae aaa tec agg atg atg ccg gcg 
Met val asn lys ser arg met met pro ala 
61/21 

ctg acg acg ggc tgt ate egg tgg tct acg 
leu thr thr gly cys ile arg trp ser thr 
121/41 

gec gca gag ttc gee gtt gcg ttg cgc aac 
ala ala glu phe ala val ala leu arg asn 
181/61 

eta teg aaa ctg cag gac ate gee aac gee 
leu ser lys leu gin asp ile ala asn ala 
241/81 

ggc tat cag gec age gtc gac tat gtg gta 
gly tyr gin ala ser val asp tyr val val 
301/101 

caa ace ccg gag ttc tec get cgc gtg ttc 
gin thr pro glu phe ser ala arg val phe 
361/121 

ggc aac acc gtg gag gcg agg gcg etc gag 
gly asn thr val glu ala arg ala leu glu 
421/141 

acg ggc ccg ctg gtg get gee ecc gec gac 
thr gly pro leu val ala ala pro ala asp 
481/161 

gac agg ctg ccg gtg tec ggt gcg gtg gtg 
asp arg leu pro val ser gly ala val val 
541/181 

cag aag gaa gac gca gee gcg cag cgc ggt 
gin lys glu asp ala ala ala gin arg gly 
601/201 

gac gag cag gcg atg ggc ggc acc ctg ggg 
asp glu gin ala met gly gly thr leu gly 
661/221 

agt gtc acc aag teg gtc gga ttc cag eta 
ser val thr lys ser val gly phe gin leu 
721/241 

etc acg gcg age acc caa agt ttc aag gee 
leu thr ala ser thr gin ser phe lys ala 
781/261 

teg teg gec aac gtg gtg atg gca ggt gcg 
ser ser ala asn val val met ala gly ala 
841/281 

ate aac gac aac ggc teg gga gtg get gcg 
ile asn asp asn gly ser gly val ala ala 
901/301 

tea ccg cat gtg tec aac gcg gta egg ttc 
ser pro his val ser asn ala val arg phe 
961/321 

att ggg tea cga aac tac gtc gag teg ctg 
ile gly ser arg asn tyr val glu ser leu 



al. (Nature 393:537-544) et contenant 



31/11 

gtg ctg gee gtg get gtg gtc gtc gca ttc 
val leu ala val ala val val val ala phe 
91/31 

cag teg egg ccc gtt gtt aac ggc ccc get 
gin ser arg pro val val asn gly pro ala 
151/51 

egg gtg age acc gac gcg atg atg gcg cac 
arg val ser thr asp ala met met ala his 
211/71 

aac gac ggc act cgc gcg gtg ggc acc cct 
asn asp gly thr arg ala val gly thr pro 
271/91 

aac aca ctg cgc aac age ggt ttt gat gtg 
asn thr leu arg asn ser gly phe asp val 
331/111 

aag gee gaa aaa ggg gtg gtg acc etc ggc 
lys ala glu lys gly val val thr leu gly 
391/131 

tac age etc ggc aca ccg ccg gac ggg gtg 
tyr ser leu gly thr pro pro asp gly val 
451/151 

gac agt ccg ggc tgc agt ccg teg gac tac 
asp ser pro gly cys ser pro ser asp tyr 
511/171 

ctg gta gat cgc ggc gtc tgt cct ttt gee 
leu val asp atg gly val cys pro phe ala 
571/191 

gcg gtg gcg ctg ate att get gac aac ate 
ala val ala leu lie ile ala asp asn ile 
631/211 

get aat acc gac gtc aag ate ccg gtg gtg 
ala asn thr asp val lys ile pro val val 
691/231 

cgc gga cag tct ggg cca acc acc gtc aag 
arg gly gin ser gly pro thr thr val lys 
751/251 

cgc aac gtc ate gcg cag acg aag acg ggg 
arg asn val ile ala gin thr lys thr gly 
811/271 

cat ttg gac age gtt ccg gaa gga ccc ggc 
his leu asp ser val pro glu gly pro gly 
871/291 

gtt ctg gaa acg gca gtg cag ctg ggg aac 
val leu glu thr ala val gin leu gly asn 
931/311 

gec ttc tgg ggc gee gag gaa ttc ggc ctg 
ala phe trp gly ala glu glu phe gly leu 
991/331 

gac ate gac gcg etc aaa ggc ate gcg ctg 
asp ile asp ala leu lys gly ile ala leu 



SEQ ID N° 19 D 
FIGURE 19D 
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1021/341 

tat ctg aac ttc gac atg ttg 
tyr leu asn phe asp met leu 
1081/361 

cag teg ctg ccg eta gac gec 
gin ser leu pro leu asp ala 
1141/381 

gag cgc acg ttc gtc gec tat 
glu arg thr phe val ala tyr 
1201/401 

gac ggt egg tec gac tac gac 
asp gly arg ser asp tyr asp 
1261/421 

tec ggc get gag gtc aag aag 
ser gly ala glu val lys lys 
1321/441 

gag cct ttc gat ccc aac tat 
glu pro phe asp pro asn tyr 
1381/461 

gcg etc ggt ate aac ggc get 
ala leu gly ile asn gly ala 
1441/481 

ggc ggc ccc aac ggg gtt ccg 

gly gly p*° asn gly val P ro 

1501/501 

tga 

OPA 



71/185 



1051/351 
gcg teg ccg aac ccg ggt 
ala ser pro asn pro gly 

1111/371 
cgc ggt cag ccg gtg gtg 
arg gly gin pro val val 

1171/391 
ctg aag atg gec ggc aag 
leu lys met ala gly lys 

1231/411 
ggc ttc acg ctg gcg ggt 
gly phe thr leu ala gly 

1291/431 
tec gec gag caa gec gag 
ser ala glu gin ala glu 

1351/451 
cac cag aag aca gac acc 
his gin lys thr asp thr 

1411/471 
ggc gtc gcg tac gcg gtg 
gly val ala tyr ala val 

1471/491 
gtc atg gcg gac cgc acc 
val met ala asp arg thr 



tac ttc 
tyr phe 


acc 
thr 


tac 
tyr 


gac 
asp 


ggt gac 


ccc gaa 
pro glu 


ggc 
gly 


teg 
ser 


gec 
axa 


ggt ate 
gly ile 


acc gcg cag 
thr ala gin 


gac 
asp 


acc 

Cat 


teg ttc 
sec pne 


ate cct 
ile pro 


teg 
ser 


ggt 
gly 


ggc 
gly 


ctg ttc 
leu phe 


etc tgg ggc 
leu trp gly 


ggc 

giy 


acc 
thr 


gec gac 
ala asp 


ctg gac 
leu asp 


cat 
his 


ate 
ile 


gac 
asp 


cgc acc 
arg thr 


ggt ttg 
gly leu 


tat 
tyr 


gcg 
ala 


cag 
gin 


gac etc 
asp leu 


cgc eac 
arg his 


ctg 
leu 


att 

ile 


gec 
ala 


aaa ccg 
lys pro 



SEQ ID N" 19D (suite) 
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ORF d'apres Cole et al. (Nature 393:537-544) et contenant Rv0418 
1/1 31/11 

tag gcc att caa cgc tct gtt cgt ttg att ggt egg tgg gat gcg aaa get gcg egg cga 
AMB ala ile gin arg ser val arg leu ile gly arg tre> asp ala lys ala ala arg arg 
61/21 91/31 

cag gcg egg tct aat ctg ggc gcg atg gtg aac aaa tec agg atg atg ccg gcg gtg ctg 
gin ala arg ser asn leu gly ala met val asn lys ser arg met met pro ala val leu 
121/41 151/51 

gcc gtg get gtg gtc gtc gca ttc ctg acg acg ggc tgt ate egg tgg tct acg cag teg 
ala val ala val val val ala phe leu thr thr gly cys ile acg trp set thr gin set 
181/61 211/71 

egg ccc gtt gtt aac ggc ccc get gcc gca gag ttc gcc gtt gcg ttg cgc aac egg gtg 
arg pro val val asn gly pro ala ala ala glu phe ala val ala leu arg asn arg val 
241/81 271/91 

age ace gac gcg atg atg gcg cac eta teg aaa ctg cag gac ate gcc aac gcc aac gac 
ser thr asp ala met met ala his leu ser lys leu gin asp ile ala asn ala asn asp 
301/101 331/111 

ggc act cgc gcg gtg ggc ace cct ggc tat cag gcc age gtc gac tat gtg gta aac aca 
gly thr arg ala val gly thr pro gly tyr gin ala ser val asp tyr val val asn thr 
361/121 391/131 

ctg cgc aac age ggt ttt gat gtg caa ace ccg gag ttc tec get cgc gtg ttc aag gcc 
leu arg asn ser gly phe asp val gin thr pro glu phe ser ala arg val phe lys ala 
421/141 ~ 451/151 

gaa aaa ggg gtg gtg acc etc ggc ggc aac acc gtg gag gcg agg gcg etc gag tac age 
glu lys gly val val thr leu gly gly asn thr val glu ala arg ala leu glu tyr ser 
481/161 * 511/171 

etc ggc aca ccg ccg gac ggg gtg acg ggc ccg ctg gtg get gee ccc gcc gac gac agt 
leu gly thr pro pro asp gly val thr gly pro leu val ala ala pro ala asp asp ser 
541/181 " ' 571/191 

ccg ggc tgc agt ccg teg gac tac gac agg ctg ccg gtg tec ggt gcg gtg gtg ctg gta 
pro gly cys ser pro ser asp tyr asp arg leu pro val ser gly ala val val leu val 
601/201 631/211 

gat cgc ggc gte tgt cct ttt gcc cag aag gaa gac gca gcc gcg cag cgc ggt gcg gtg 
asp arg gly val cys pro phe ala gin lys glu asp ala ala ala gin arg gly ala val 
661/221 ~ 691/231 

gcg ctg ate att get gac aac ate gac gag cag gcg atg ggc ggc acc ctg ggg get aat 
ala leu ile ile ala asp asn ile asp glu gin ala met gly gly thr leu gly ala asn 
721/241 751/251 

acc gac gtc aag ate ccg gtg gtg agt gtc acc aag teg gtc gga ttc cag eta cgc gga 
thr asp val lys ile pro val val ser val thr lys ser val gly phe gin leu arg gly 
781/261 811/271 

cag tct ggg cca ace acc gtc aag etc acg gcg age acc caa agt ttc aag gcc cgc aac 
gin ser gly pro thr thr val lys leu thr ala ser thr gin ser phe lys ala arg asn 
841/281 * 871/291 

gtc ate gcg cag acg aag acg ggg teg teg gcc aac gtg gtg atg gca ggt gcg cat ttg 
val ile ala gin thr lys thr gly ser ser ala asn val val met ala gly ala his leu 
901/301 931/311 

gac age gtt ccg gaa gga ccc ggc ate aac gac aac ggc teg gga gtg get gcg gtt ctg 
asp ser val pro glu gly pro gly ile asn asp asn gly ser gly val ala ala val leu 
961/321 ' ~ " ~ 991/331 

gaa acg gca gtg cag ctg ggg aac tea ccg cat gtg tec aac gcg gta egg ttc gee ttc 
glu thr ala val gin leu gly asn ser pro his val ser asn ala val arg phe ala phe 

SEQ ID H° 19 F 
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1021/341 1051/351 

tgg ggc gcc gag gaa ttc ggc ctg att ggg tea cga aac tac gtc gag teg ctg gae ate 
trp gly ala glu glu phe gly leu ile gly ser arg asn tyr val glu ser leu asp ile 
1081/361 1111/371 

gae geg etc aaa ggc ate gcg etg tat ctg aac ttc gae atg ttg gcg teg ccg aac ccg 
asp ala leu lys gly ile ala leu tyr leu asn phe asp met leu ala ser pro asn pro 
1141/381 1171/391 

ggt tac ttc acc tac gae ggt gae eag teg etg ccg eta gae gcc cgc ggt eag ccg gtg 
gly tyr phe thr tyr asp gly asp gin ser leu pro leu asp ala arg gly gin pro val 
1201/401 1231/411 

gtg ccc gaa ggc teg gcc ggt ate gag cgc acg ttc gtc gcc tat ctg aag atg gcc ggc 
val pro glu gly ser ala gly ile glu arg thr phe val ala tyr leu lys met ala gly 
1261/421 1291/431 

aag acc gcg cag gae acc teg ttc gae ggt egg tec gae tac gae ggc ttc acg ctg gcg 
ly3 thr ala gin asp thr ser phe asp gly arg ser asp tyr asp gly phe thr leu ala 
1321/441 1351/451 

ggt ate cct teg ggt ggc ctg ttc tec ggc get gag gte aag aag tec gee gag caa gee 
gly ile pro ser gly gly leu phe ser gly ala glu val lys lys ser ala glu gin ala 
1381/461 1411/471 

gag etc tgg ggc ggc acc gcc gae gag cct tte gat ccc aac tat cae cag aag aca gae 
glu leu trp gly gly thr ala asp glu pro phe asp pro asn tyr his gin lys thr asp 
1441/481 1471/491 

acc ctg gae cat ate gae cgc acc gcg etc ggt ate aac ggc get ggc gtc gcg tac gcg 
thr leu asp his ile asp arg thr ala leu gly ile asn gly ala gly val ala tyr ala 
1501/501 1531/511 

gtg ggt ttg tat gcg cag gae etc ggc ggc ccc aac ggg gtt ccg gtc atg gcg gae cgc 
val gly leu tyr ala gin asp leu gly gly pro asn gly val pro val met ala asp arg 
1561/521 

acc cgc cac ctg att gcc aaa ccg tga 
thr arg his leu ile ala lys pro OPA 

SEQ ID N° 19F (suite) 
FIGURE 19F (suite) 



CGA GAC AGT GGT GCG GGA CAC 
arg asp ser gly ala gly his 
61/21 

CGC GGT GTG GGA CTC ACG TTC 
arg gly val gly leu thr phe 
121/41 

GGC CGG CTG GCA ACC GTC GGT 
gly arg leu ala thr val gly 
181/61 

TGA GCT CCC CGT TTT GCT GGA 
OPA ala pro arg phe ala gly 
241/81 

GCA CAT GGT GCC GGC AGG GAG 
ala his gly ala gly arg glu 
301/101 

TCG GTG CGT GCA TGC TCG CAG 
ser val arg ala cys ser gin 
361/121 

CCG ACA AAT CCG GAC CAC TGC 
pro thr asn pro asp his cys 







31/11 




TTG 


AGT 


TCG GCT GCT 


AAC 


leu 


ser 


ser ala ala 


asn 






91/31 




GGT 


GAG 


GGT ACA GCG 


GAC 


gly 


glu 


gly thr ala 


asp 






151/51 




TTC 


GAC 


GTT GGT GAC 


GAC 


phe 


asp 


val gly asp 


asp 






211/71 




TGC 


CCA 


GGC ACC GCC 


GGT 


cys 


pro 


gly thr ala 


gly 






271/91 




GAA 


CAG 


TGG GCA AGC 


AGC 


glu 


gin 


trp ala ser 


ser 






331/111 




CCG 


GAT 


GCA CCA ACG 


TGG 


pro 


asp 


ala pro thr 


trp 


ATC 


AGG 


ATC 




ile 


arg 


ile 





SEQ ID N p 20A 



GAC GCC AGA GTC GCC CGC TTC 
asp ala arg val ala arg phe 

CTT CGA GCA CGC AAT ATC GTG 
leu arg ala arg asn ile val 

CCC TCG TTC ATG AAT CGT TCT 
pro ser phe met asn arg ser 

ACT GCT GCG CTT AAG CTT GTC 
thr ala ala leu lys leu val 

TAG CCG CGC TCG CCG CGC TGG 
AMB pro arg ser pro arg trp 

TCG ACG GGA CCG CCG TGG CTG 
ser thr gly pro pro trp leu 



FEUILLE DE REM^L^E^REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



74/185 

















32/11 












GAG ACA GTG 


GTG 


CGG 


GAC 


ACT 


TGA GTT 


CGG 


CTG CTA ACG ACG 


CCA 


GAG 






UCi ICC 


glu thr val 


val 


arg 


asp 


thr 


OPA val 


arg 


leu leu thr thr pro glu 


ser 


pro 


ala ser 


62/21 














92/31 










GCG GTG TGG 


GAC TCA CGT 


TCG 


GTG AGG 


GTA 


CAG CGG ACC TTC 


GAG 


CAC 


bCA 


ATA 


TCG TGG 


ala val trp 


asp 


ser 


arg 


ser 


val arg 


val 


gin arg thr phe 


glu his 


did 


i 1 o 


ser trp 


122/41 














152/51 










GCC GGC TGG 


CAA CCG 


TCG 


GTT 


TCG ACG 


TTG 


GTG ACG ACC CCT 


CGT 


TCA 


TGA 


ATC 


GTT CTT 


a-La wiu 


gin pro 


ser 


val 


ser thr 


leu 


val thr thr pro 




ser 


OPA 


ile 


val leu 


182/61 














212/71 










GAG CTC CCC 


GTT 


TTG CTG 


GAT 


GCC CAG 


GCA 


CCG CCG GTA CTG 


CTG 


CGC 


TTA 


AGC 


TTG TCG 


glu leu pro 


val 


leu 


leu 


asp ala gin 


ala 


pro pro val leu 


leu 


arg 


leu 


ser 


leu ser 


242/81 














272/91 










CAC ATG GTG 


CCG 


GCA 


GGG 


AGG 


AAC AGT 


GGG 


CAA GCA GCT AGC 


CGC 


GCT 


CGC 


CGC 


GCT GGT 


his met val 


pro 


ala 


gly 


arg 


asn ser 


gly 


gin ala ala ser 


arg 


ala 


arg 


arg 


ala gly 


302/101 














332/111 




CGG TGC GTG 


CAT 


GCT 


CGC 


AGC 


CGG ATG 


CAC 


CAA CGT GGT CGA CGG 


GAC 


CGC 


CGT 


GGC TGC 


arg cys val 
362/121 


his 


ala 


arg 


ser 


arg met 


his 


gin arg gly arg 


arg 


asp 


arg 


arg 


gly cys 


CGA CAA ATC 


CGG 


ACC 


ACT 


GCA TCA GGA TC 














arg gin ile 


arg 


thr 


thr 


ala 


ser gly 

















SEQ ID N° 20B 
FIGURE 20B 



AGA CAG TGG TGC GGG ACA CTT GAG TTC GGC 
arg gin trp cys gly thr leu glu phe gly 
63/21 

CGG TGT GGG ACT CAC GTT CGG TGA GGG TAC 
arg cys gly thr his val arg OPA gly tyr 
123/41 

CCG GCT GGC AAC CGT CGG TTT CGA CGT TGG 
pro ala gly asn arg arg phe arg arg trp 
183/61 

AGC TCC CCG TTT TGC TGG ATG CCC AGG CAC 
ser ser pro phe cys trp met pro arg his 
243/81 

ACA TGG TGC CGG CAG GGA GGA ACA GTG GGC 
thr trp cys arg gin gly gly thr val gly 
303/101 

GGT GCG TGC ATG CTC GCA GCC GGA TGC ACC 
gly ala cys met leu ala ala gly cys thr 
363/121 

GAC AAA TCC GGA CCA CTG CAT CAG GAT C 
asp lys ser gly pro leu his gin asp 



33/11 


















TGC TAA 


CGA 


CGC 


CAG 


AGT 


CGC 


CCG 


CTT 


CCG 


cys OCH 


arg arg gin 


ser 


arg 


pro 


leu 


pro 


93/31 
















AGC GGA 


CCT 


TCG 


AGC 


ACG 


CAA 


TAT 


CGT 


GGG 


ser gly 


pro 


ser 


ser 


thr 


gin 


tyr 


arg gly 


153/51 


















TGA CGA 


CCC 


CTC 


GTT 


CAT 


GAA 


TCG 


TTC 


TTG 


OPA arg 


pro 


leu 


val 


his 


glu 


ser 


phe 


leu 


213/71 














CGC CGG 


TAC 


TGC 


TGC 


GCT 


TAA 


GCT 


TGT 


CGC 


arg arg 


tyr cys 


cys 


ala 


OCH 


ala 


cys 


arg 


273/91 














AAG CAG 


CTA 


GCC 


GCG 


CTC 


GCC 


GCG 


CTG 


GTC 


lys gin 


leu 


ala 


ala 


leu 


ala 


ala 


leu 


val 


333/111 


















AAC GTG 


GTC 


GAC 


GGG 


ACC 


GCC 


GTG 


GCT 


GCC 


asn val 


val 


asp 


gly 


thr 


ala 


val 


ala 


ala 



SEQ ID N° 20C 
FEUILLE DE REMp^HlfilEWREGLE 26) 
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partie de la sequence nucleotidique de seq20A 
1/1 31/11 

TGT GGG ACT CAC GTT CGG TGA GGG TAC AGC GGA CCT TCG AGC ACG CAA TAT CGT GGG CCG 
cys gly thr his val arg OPA gly tyr ser gly pro ser ser thr gin tyr arg gly pro 
61/21 91/31 . 

GCT GGC AAC CGT CGG TTT CGA CGT TGG TGA CGA CCC CTC GTT CAT GAA TCG TTC TTG AGC 
ala gly asn arg arg phe arg arg trp OPA arg pro leu val his glu ser phe leu ser 
121/41 151/51 

TCC CCG TTT TGC TGG ATG CCC AGG CAC CGC CGG TAC TGC TGC GCT TAA GCT TGT CGC ACA 
ser pro phe cys trp met pro arg his arg arg tyr cys cys ala OCH ala cys arq thr 
181/61 211/71 

TGG TGC CGG CAG GGA GGA ACA GTG GGC AAG CAG CTA GCC GCG CTC GCC GCG CTG GTC GGT 
trp cys arg gin gly gly thr val gly lys gin leu ala ala leu ala ala leu val glv 
241/81 271/91 

GCG TGC ATG CTC GCA GCC GGA TGC ACC AAC GTG GTC GAC GGG ACC GCC GJG GCT GCC GAC 
ala cys met leu ala ala gly cys thr asn val val asp gly thr ala val ala ala asp 
301/101 

AAA TCC GGA CCA CTG CAT CAG GAT C 
lys ser gly pro leu his gin asp 



SEQ ID N° 20A' 
FIGURE 20A' 



1/1 

GTG GGA CTC ACG TTC GGT GAG 
val gly leu thr phe gly glu 
61/21 

CTG GCA ACC GTC GGT TTC GAC 
leu ala thr val gly phe asp 
121/41 

CCC CGT TTT GCT GGA TGC CCA 
pro arg phe ala gly cys pro 
181/61 

GGT GCC GGC AGG GAG GAA CAG 
gly ala gly arg glu glu gin 
241/81 

CGT GCA TGC TCG CAG CCG GAT 
arg ala cys ser gin pro asp 
301/101 

AAT CCG GAC CAC TGC ATC AGG 
asn pro asp his cys ile arg 







31/11 




GGT ACA 


GCG 


GAC CTT 


CGA 


gly thr 


ala 


asp leu 


arg 






91/31 




GTT GGT 


GAC 


GAC CCC 


TCG 


val gly 


asp 


asp pro 


ser 






151/51 




GGC ACC 


GCC 


GGT ACT 


GCT 


gly thr 


ala 


gly thr 


ala 






211/71 




TGG GCA 


AGC 


AGC TAG 


CCG 


trp ala 


ser 


ser AMB 


pro 






271/91 




GCA CCA 


ACG 


TGG TCG 


ACG 


ala pro 


thr 


trp ser 


thr 



ATC 
ile 



SEQ ID N° 20B' 
FIGURE 2GB' 



GCA CGC AAT ATC GTG GGC CGG 
ala arg asn ile val gly arg 

TTC ATG AAT CGT TCT TGA GCT 
phe met asn arg ser CPA ala 

GCG CTT AAG CTT GTC GCA CAT 
ala leu lys leu val ala his 

CGC TCG CCG CGC TGG TCG GTG 
arg ser pro arg trp ser val 

GGA CCG CCG TGG CTG CCG ACA 
gly pro pro trp leu pro thr 



FEUILLE DE REMPLACEMENT (REGLE 26) 



WO 99/09186 



PCT/FR98/01813 



76/185 



1/1 31/11 

GTG TGG GAC TCA CGT TCG GTG AGG GTA CAG CGG ACC TTC GAG CAC GCA ATA TCG TGG GCC 
val trp asp ser arg ser val arg val gin arg thr phe glu hi3 ala ile ser trp ala 
61/21 91/31 

GGC TGG CAA CCG TCG GTT TCG ACG TTG GTG ACG ACC CCT CGT TCA TGA ATC GTT CTT GAG 
gly trp gin pro ser val ser thr leu val thr thr pro arg ser OPA ile val leu glu 
121/41 151/51 

CTC CCC GTT TTG CTG GAT GCC CAG GCA CCG CCG GTA CTG CTG CGC TTA AGC TTG TCG CAC 
leu pro val leu leu asp ala gin ala pro pro val leu leu arg leu ser leu 3er his 
181/61 211/71 

ATG GTG CCG GCA GGG AGG AAC AGT GGG CAA GCA GCT AGO CGC GCT CGC CGC GCT GGT CGG 
met val pro ala gly arg asn ser gly gin ala ala ser arg ala arg arg ala gly arg 
241/81 271/91 

TGC GTG CAT GCT CGC AGC CGG ATG CAC CAA CGT GGT CGA CGG GAC CGC CGT GGC TGC CGA 
cys val his ala arg ser arg met his gin arg gly arg arg asp arg arg gly cys arg 
301/101 

CAA ATC CGG ACC ACT GCA TCA GGA TC 
gin ile arg thr thr ala ser gly 

SEQ ID N° 20C 
FIGURE 20C 



sequence Rv3576 predite par Cole etal. (Nature 393:537-544) et con tenant seq20A* 
1/1 31/11 

atg ggc aag cag eta gec gcg etc gec gcg ctg gtc ggt gcg tgc atg etc gca gec gga 
met gly lys gin leu ala ala leu ala ala leu val gly ala cys met leu ala ala gly 
61/21 91/31 

tgc acc aac gtg gtc gac ggg acc gec gtg get gec gac aaa tec gga cca ctg cat cag 
cys thr asn val val asp gly thr ala val ala ala a3p lys ser gly pro leu his gin 
121/41 151/51 

gat ccg ata ccg gtt tea gcg ctt gaa ggg ctg ctt etc gac ttg age cag ate aat gec 
asp pro ile pro val ser ala leu glu gly leu leu leu asp leu ser gin ile asn ala 
181/61 211/71 

gcg ctg ggt gcg aca teg atg aag gtg tgg ttc aac gec aag gca atg tgg gac tgg age 
ala leu gly ala thr ser met lys val trp phe asn ala lys ala met trp aso trp ser 
241/81 271/91 

aag age gtg gee gac aag aat tgc ctg get ate gac ggt cca gca cag gaa aag gtc tac 
lys ser val ala asp lys asn cys leu ala ile asp gly pro ala gin glu lys val tyr 
301/101 331/111 

gec ggc acc ggg tgg acc get atg cgc ggc caa egg ctg gat gac age ate gat gac tec 
ala gly thr gly trp thr ala met arg gly gin arg leu asp asp ser ile asp asp ser 
361/121 391/131 

aag aaa cgc gac cac tac gec att caa gcg gtc gtc ggc ttc ccg acc gca cat gat gec 
lys lys arg asp hi3 tyr ala ile gin ala val val gly phe pro thr ala his asp ala 
421/141 451/151 

gag gag ttc tac age tec teg gtg caa age tgg age age tgc teg aac cgc egg ttt gtc 
glu glu phe tyr ser ser ser val gin ser trp ser ser cys ser asn arg arg phe val 
481/161 511/171 

gaa gtc acc ecc gga cag gac gac gec gec tgg act gtg get gac gtt gtc aac gac aac 
glu val thr pro gly gin asp asp ala ala trp thr val ala asp val val asn asp asr. 
541/181 571/191 

ggc atg etc agt age teg cag gtt cag gaa ggc ggc gac gga tgg acc tgc cag cgt gee 
gly met leu ser 3er sor gin val gin glu gly gly asp gly trp thr cys gin arg ala 
601/201 631/211 

ctg act gcg cgc aac aac gtc act ate gac att gtc acg tgc gec tat age caa ccg gat 
leu thr ala arg asn asn val thr ile asp ile val thr cys ala tyr ser gin pro asp 
661/221 691/231 

ttg gtg gcg att ggc ate get aac caa ate gcg gec aag gtt get aag cag tag 
leu val ala ile gly ile ala asn gin ile ala ala lys val ala lys gin AMB 

SEQ ID N° 20D 



FIGURE 20D 
FEUILLE DE REMPLACEMENT (REGLE 26) 



